o3 puntúa tan alto como programadores humanos en un test de razonamiento y abstracción. Es justo lo que OpenAI necesita

22 meneos

150 clics

o3 puntúa tan alto como programadores humanos en un test de razonamiento y abstracción. Es justo lo que OpenAI necesita

El lanzamiento el pasado viernes de o3 quizás pasó algo desapercibido ante la avalancha de lanzamientos de OpenAI. En parte porque apareció quizás demasiado rápido —o1 apenas fue lanzado tres meses antes— y en parte porque no está aún disponible para el público. Y aun así todo lo que nos llega nos hace pensar que estamos ante un modelo muy especial.

| etiquetas: ia , desarrollo , software , programación

19 3 1 K 150

14 comentarios

19 3 1 K 150

#1 sorrillo *

En el titular donde pone "en un" faltaría indicar el qué, posiblemente sea "test" o "en una prueba" (ya sé que el titular original está también mal, pero habría que subsanarlo igualmente).

2 33

#3 DenisseJoel

Faltaría indicar que se trata de tests diseñados para poder ser corregidos de manera automática, que, vaya casualidad, son justo aquellos en los que la IA se desempeña mejor.

1 18

#4 sorrillo *

¿Ahora parte de mover la portería es que deban ser tests donde la respuesta sea subjetiva y dependa del buen o mal humor del corrector y de sus sesgos?

En fin ...

1 23

#5 DenisseJoel *

No, no se trata de mover la portería. O bueno, en parte sí, porque hace décadas se pensaba que cuando tuviéramos un modelo capaz de jugar bien al ajedrez, estaríamos cerca de la la inteligencia artificial general, y evidentemente era una percepción errónea.

Pero más allá de esos matices, se ponga un ejemplo concreto: ahora dicen que algunos LLM tienen un nivel matemático elevado. Y lo dicen porque puede resolver un problema matemático y devolver los números correctos. Pero la matemática… » ver todo el comentario

1 18

#6 sorrillo

Para resultados matemáticos tanto en matemáticas como en física los humanos nos asistimos de calculadoras y de ordenadores, no veo razón para que la IA no pueda usar esas mismas herramientas para resolver esos mismos problemas. No nos hace menos inteligentes usar ese tipo de tecnología para asistirnos y en los mismos términos no hace a la IA menos inteligente el usar ese tipo de tecnologías para asistirla.

Me parece un tremendo error pretender valorar la inteligencia de una IA en función de… » ver todo el comentario

0 12

#7 anodino

expláyate, es interesante tu comentario

0 6

#8 DenisseJoel

¿La parte de daños? Por ejemplo, la contaminación del texto publicado. Es posible que pronto, si no ha sucedido ya, se publique en internet más texto generado por LLMs que por personas. Texto diseñado para ser verosímil pero con numerosos errores, y con sesgos de todo tipo.
También hay que tener en cuenta el coste medioambiental y de recursos. Tanto en el entrenamiento de los modelos como la inferencia requieren grandes cantidades de energía.
A nivel político, las posibilidades de realizar… » ver todo el comentario

0 10

#11 donchan

cuando tuviéramos un modelo capaz de jugar bien al ajedrez, estaríamos cerca de la la inteligencia artificial general

Pero había una condición implícita, que era "razonando tal y como lo hace un humano", que no es como las máquinas se enfrentan al problema, por lo que los rendimientos no son comparables.

O dicho de otro modo, resulta que existe una forma de calcular buenas jugadas de ajedrez que no implican habilidades de razonamiento general.

Puesto que esta notícia va de o3, pues comento que este modelo de AI es el que se desarrolló para jugar al go, que es algo muy distinto del ajedrez.

0 7

#13 rojo_separatista

, o3 ha sacado muy buenas puntuaciones en FrontierMath que es un benchmark matemático altamente demandante, no se basa en aplicar de memoria un método sino que se trata de analizar y aplicar conocimientos profundos de matemáticas en álgebra, geometría, cálculo... A los matemáticos profesionales les cuesta días resolver cada uno de los problemas. Cada vez que se sube el nivel de exigencia a la IA está la termina superando.

Estamos en un escenario en que ya tenemos IAs que son mejores que la… » ver todo el comentario

1 9

#12 rojo_separatista

, son exactamente los mismos tests que se usan para evaluar el nivel de los programadores humanos en competiciones de programación.

0 11

#2 JackNorte

dupe me adelante ayer. www.meneame.net/m/actualidad/nuevo-modelo-open-ai-o3-increibles-result

0 14

#9 Armagnac

No sé rick... hasta ahora chatgpt no ha dado ni una las veces que le he preguntado algo relacionado con código. De hecho la información que me ha dado raramente me ha servido tal cual aunque he de reconocer que es una buena base para seguir investigando

0 11

#14 rojo_separatista

, pues háztelo mirar, porque creo que estás haciendo algo muy mal.

0 11

#10 donchan

Puntúa alto, pero con una condición, que se llama 1000€.

0 7

menéame

condiciones legales / de uso / y de cookies
/ quiénes somos
/ licencias: código, gráficos, contenido
/ HTML5
/ codigo fuente

Actualidad y sociedad

más visitadas

Intxaurrondo & Borja Semper (PP) - Definición de hipocresía pepera Cap. 24

Los tres grandes perdedores del teletrabajo, según un economista, que explican el porqué del empeño de volver a las oficinas

Catedrático en Derecho explica la actuación del Juez Peinado en el programa de Silvia Intxaurrondo

VÍDEO| Una candidata a congresista de Texas propone ejecuciones públicas a los inmigrantes ilegales que maten o violen y lo "escenifica"

Entrevista a Óscar Puente, por Detective Murciano (ft Zorrorifico y Pedraxe)

más votadas

Seguidores de Luigi Mangione recaudan casi 200.000 dólares para pagar su defensa

Marta Gontá, sobre la macrocelulosa Altri: "La Xunta ha decidido que esta empresa puede expropiar a los vecinos"

Jon Iñarritu le recuerda a cacatúa del PP los orígenes franquistas y genocidas de su "partido"

El Gobierno de Mazón elimina los impuestos para la reducción de emisiones de CO2 a días de su entrada en vigor

Los continuos ataques de Israel dejan fuera de servicio los últimos hospitales operativos en el norte de Gaza

suscripciones por RSS

o3 puntúa tan alto como programadores humanos en un test de razonamiento y abstracción. Es justo lo que OpenAI necesita