Tecnología, Internet y juegos

encontrados: 2, tiempo total: 0.059 segundos rss2
27 meneos
257 clics
¿Qué es OPT-175B (alpa)? La alternativa de código abierto a chatGPT y GPT-3

¿Qué es OPT-175B (alpa)? La alternativa de código abierto a chatGPT y GPT-3

Alpa es un sistema de código abierto para el entrenamiento y el servido de redes neuronales a gran escala. Alpa tiene como objetivo automatizar el entrenamiento y el servido distribuido a gran escala con solo unas pocas líneas de código. Alpa fue desarrollado inicialmente por personas en el Sky Lab, UC Berkeley. Algunas técnicas avanzadas utilizadas en Alpa se han escrito en un artículo publicado en OSDI 2022. La comunidad de Alpa está creciendo con nuevos contribuyentes de Google, Amazon, AnyScale y más.
20 7 0 K 168
20 7 0 K 168
11 meneos
127 clics

Meta ha construido una nueva IA de lenguaje masivo, y la está regalando de forma gratuita. [ENG]

Meta está haciendo que su modelo, llamado Open Pretrained Transformer (OPT), esté disponible para uso no comercial. También está lanzando su código y un libro de registro que documenta el proceso de entrenamient. El libro de registro contiene actualizaciones diarias de los miembros del equipo sobre los datos de entrenamiento: cómo se agregaron al modelo y cuándo, qué funcionó y qué no. En más de 100 páginas de notas, los investigadores registran cada error, bloqueo y reinicio en un proceso de capacitación de tres meses que se ejecutó sin parar

menéame