Tecnología, Internet y juegos

encontrados: 2, tiempo total: 0.012 segundos rss2
8 meneos
84 clics

Introducción a los modelos grandes de lenguaje (Large Language Models) (Andrej Karpathy) [ENG]  

Se trata de una introducción de una hora de duración a los modelos de grandes lenguajes: el componente técnico básico de sistemas como ChatGPT, Claude y Bard. Qué son, hacia dónde se dirigen, comparaciones y analogías con los sistemas operativos actuales y algunos de los retos relacionados con la seguridad de este nuevo paradigma informático. Actualizado a noviembre de 2023 (¡este campo se mueve rápido!).
10 meneos
121 clics

Construyamos GPT: desde cero, en código, deletreado (Andrej Karpathy) [ENG]  

Construimos un Generatively Pretrained Transformer (GPT), siguiendo el paper "Attention is All You Need" y el GPT-2 / GPT-3 de OpenAI. Hablamos de las conexiones con ChatGPT, que ha arrasado en todo el mundo. Vemos cómo GitHub Copilot, en sí mismo un GPT, nos ayuda a escribir un GPT (meta :D!) . [ nota: Andrej Karpathy es uno de los mayores expertos en IA ]

menéame