OpenAI presenta MLE-bench: un nuevo estándar para evaluar agentes de Inteligencia Artificial en tareas de ingeniería de Machine Learning

8 meneos

64 clics

OpenAI presenta MLE-bench: un nuevo estándar para evaluar agentes de Inteligencia Artificial en tareas de ingeniería de Machine Learning

Esta nueva herramienta se compone de 75 competiciones seleccionadas cuidadosamente, abarcando una amplia gama de tareas como entrenamiento de modelos, preparación de datos y experimentación, con el fin de proporcionar una medición precisa y detallada de las capacidades de los agentes en entornos reales de ML. arxiv.org/abs/2410.07095

6 2 0 K 11 tecnología

2 comentarios

6 2 0 K 11 tecnología

Click para ver los comentarios

menéame

condiciones legales / de uso / y de cookies
/ quiénes somos
/ licencias: código, gráficos, contenido
/ HTML5
/ codigo fuente

más visitadas

BYD Denza Z9 GT muestra las ventajas de su dirección trasera

¿Por qué EEUU es el paraíso de las sectas y los tiroteos?

El patriota

"¡Se juega años de cárcel!" Silvia intxaurrondo desmiente a Ayuso en directo. "No es una multa, o no se ha enterado o está mintiendo"

Sam Altman tenía un plan para convertir a OpenAI en una for-profit. La megaoferta de Elon Musk se lo va a complicar mucho

más votadas

"¡Se juega años de cárcel!" Silvia intxaurrondo desmiente a Ayuso en directo. "No es una multa, o no se ha enterado o está mintiendo"

PACMA denuncia la agresión a una vecina de A Coruña tras irrumpir varios cazadores en su propiedad para cazar zorros

Valve borra de Steam todos los juegos que obligan a visualizar anuncios

La humanidad pierde la primera gran "batalla" contra el cambio climático

El actor judío Wallace Shawn afirma que Israel es «demoníacamente malvado», peor que los nazis [ENG]

suscripciones por RSS

OpenAI presenta MLE-bench: un nuevo estándar para evaluar agentes de Inteligencia Artificial en tareas de ingeniería de Machine Learning