cultura y tecnología
8 meneos
63 clics
OpenAI presenta MLE-bench: un nuevo estándar para evaluar agentes de Inteligencia Artificial en tareas de ingeniería de Machine Learning

OpenAI presenta MLE-bench: un nuevo estándar para evaluar agentes de Inteligencia Artificial en tareas de ingeniería de Machine Learning

Esta nueva herramienta se compone de 75 competiciones seleccionadas cuidadosamente, abarcando una amplia gama de tareas como entrenamiento de modelos, preparación de datos y experimentación, con el fin de proporcionar una medición precisa y detallada de las capacidades de los agentes en entornos reales de ML. arxiv.org/abs/2410.07095

| etiquetas: openai , mle-bench , inteligencia artificial , machine learning , kaggle
Y curiosamente las IA que mejor puntuación tendrán serán las de ClosedAI
#1 claro de eso va todo esto :-)
comentarios cerrados

menéame