Noticias de ciencia y lo que la rodea
10 meneos
74 clics
ByteDance AI presenta Doubao-1.5-Pro: Iguala las pruebas GPT 4o y Claude 3.5 Sonnet a un precio 50 veces inferior [eng]

ByteDance AI presenta Doubao-1.5-Pro: Iguala las pruebas GPT 4o y Claude 3.5 Sonnet a un precio 50 veces inferior [eng]

ByteDance, empresa tecnológica china famosa por crear TikTok, ha lanzado Doubao-1.5-Pro, un modelo de lenguaje de IA con un modo "Deep Thinking" que iguala el rendimiento de GPT-4o o Claude 3.5 Sonnet; supera a modelos como deepseek-v3 y llama3.1-405B en pruebas como AIME con unos costos operativos 5 veces menores que DeepSeek y 200 veces menores que el modelo O1 de OpenAI.

| etiquetas: moe , ia , tiktok , doubao
#1 MPR *
Curioso, parece que fue ayer cuando leí una noticia idéntica pero con otro nombre: DeepSeek.

Lo de la reducción de costes de las IA chinas, si es verdad, sería digno de estudiar.
#1 MoE. Cuando le haces una pregunta a Doubao, en lugar de "despertar" a todos los expertos de su modelo en memoria a la vez, solo usa a uno de cada siete. Encuentra a los que saben exactamente cómo ayudar en cada problema concreto. Así:

- Usa menos energía: Solo trabaja con una parte y es mucho más rápido
- Pero lo hace más preciso e inteligente: Aunque solo usa una parte de su conocimiento, resuelve los problemas 7 veces mejor que si usara a todos sin un orden establecido.

Es como si tuvieras una caja de pinturas enorme y, en lugar de pintar con todos los colores al mismo tiempo, solo eliges los 2 o 3 perfectos para hacer el dibujo que quieres.

La ingeniería china está propagando innovaciones asombrosas en todos los terrenos y, en la IA, están barriendo.

#3 Creo que no es así exactamente en este caso. Estos nuevos algoritmos no están basándose en la fuerza bruta del a GPU. Al contrario. De hecho DeepSeek, en China, tuvo que trabajar con GPUs de Nvidia capadas, por restricciones del gobierno USA.
#4 Reciclan lo que ya existe; sin los avances de Occidente, estos modelos no existirían ni serían accesibles al público.
#8 Falso: Es un modelo de datos autónomo (sin usar outputs de otros LLMs) y su sistema de recompensa unificado son contribuciones originales, según sus publicaciones técnicas. (p. ej., datos de Doubao son en un 80% en chino)

Tu afirmación podría tener parte de verdad (la IA es un esfuerzo colectivo global), pero ignoras:

- Que Doubao y otros modelos chinos aportan innovaciones específicas (optimización de MoE, pipelines de datos éticos).
- Que China ya tiene ecosistemas tecnológicos autónomos en hardware, software y aplicaciones prácticas.

Chips como los Ascend de Huawei, frameworks como MindSpore, y modelos lingüísticos entrenados en corpus chino. Además, Doubao-1.5-Pro se ejecuta en Volcano Engine (plataforma cloud de ByteDance), sin depender de AWS/Azure.
#10 Como ocurre con muchos chinos, tengo mis dudas sobre todas esas afirmaciones, ya que suelen ser verdades a medias. Los chinos nunca se han caracterizado por ser completamente transparentes en nada. Dicho esto, me parece fantástico que otros actores impulsen la situación y logren que otros evolucionen.
#11 DeepSeek, la otra IA china, es opensource, con licencia MIT. Puedes dudar de sus métodos de entrenamiento, pero no se puede ser más transparente en cuanto a los resultados.

Por otra parte, creo que seguimos menospreciando las capacidades de China. Podemos ir en contra de ellos (como está haciendo USA y perdiendo) o al lado de ellos (que no de la mano); sospecho que si nos ponemos en contra lo vamos a pagar.
#12 Europa necesita despertar del letargo tecnológico. China debe ser observada con atención, ya que su falta de transparencia debería ser suficiente para alertar a cualquiera. Nunca se debería alentar a un país con un régimen como el chino.
Estos malditos chinos comunistas, como siempre,jodiendo a occidente
Esto lo explica, en parte, la Ley de Huang (para GPUs e IA): Jensen Huang, CEO de NVIDIA, propuso que la capacidad de las GPUs para entrenar modelos de IA se ha duplicado cada 6 meses. Esto es más rápido que la Ley de Moore original (que decía que los transistores en un chip se duplican cada dos años)
#3 Los chinos están consiguiendo obtener más rendimiento a las GPUs.

Optimizan el software, no el hardware.
#3 Eso debería ser igual para todos los competidores, pero parece que son los chinos los que se llevan la palma y eso no lo explica tu afirmación.
Que sepan que si quieren operar en los EEUU le tendrán que vender el modelo a una empresa estadounidense. :-D
comentarios cerrados

menéame