Noticias de ciencia y lo que la rodea
5 meneos
57 clics

Autorrefinamiento: Refinamiento iterativo con auto-retroalimentación

Al igual que las personas, los LLM no siempre generan el mejor texto para un problema de generación dado en su primer intento (por ejemplo, resúmenes, respuestas, explicaciones). Así como las personas luego refinan su texto, presentamos SELF-REFINE, un marco para mejorar de manera similar los resultados iniciales de los LLM a través de retroalimentación iterativa y refinamiento. La idea principal es generar una salida usando un LLM, luego permitir que el mismo modelo proporcione retroalimentación de múltiples aspectos para su propia salida.

| etiquetas: ia , llm , entrenamiento
La IA que se entrena a sí misma sin necesidad de aprendizaje supervisado. Un pasito más hacia algo gigantesco. En cierta forma copia nuestra forma de re-pensar las cosas y aprender mediante reflexión.
Lo probé y tras un montón de rondas de autorefinamiento acabé tocando el clavicémbalo en Montefiore mientras ideaba recetas para cocinar el hígado de Clarisse :goatse:
comentarios cerrados

menéame