Con la tercera versión de su gran modelo lingüístico, lanzada en diciembre, la empresa china de inteligencia artificial DeepSeek puede haber echado por tierra la idea de que las mejores IA requieren miles de millones de dólares y los chips más avanzados. Por sólo 5,6 millones de dólares, o el 7% del coste de desarrollo de ChatGPT, Pekín consiguió crear una IA comparable a los modelos estadounidenses.
|
etiquetas: inteligencia artificial , ia , chatgpt , china
Preguntar eso sólo sirve para unas risas y nada más, no tiene ningún valor real.
"A message posted to Blind… has been making the rounds suggesting Meta is in crisis over the success of DeepSeek because of how quickly it surpassed Meta’s own efforts to be the king of open source AI with its Llama models."
www.unz.com/mwhitney/chinas-deepseek-ai-moves-the-capital-of-tech-from
Aquí podéis ver pantallazo del mensaje en cuestión, es imposible subir imágenes.
ChatGPT
Tú dijiste:
Navantia pierde el… » ver todo el comentario
Si, uso Chatgpt
Lo uso para encontrar noticias que a veces me llegan sin enlace (a través de algún grupo de WhatsApp) y buscar si se ha subido a Meneame (a la espera de que el buscador de MNM funcione algún día).
En lo último pincha, la noticia sobre Navantia era dupe
www.google.com/search?q=site:meneame.net inurl:navantia&hl=es&
Deepseek-R1 es un modelo.
Otra cosa es la mierda de "ollama" y cómo manipulan para confundir al personal, con nombres como "deepseek-r1:14b" cuando no es Deepseek-R1 sino "distills" de otros modelos.
Deepseek-R1 es la ostia. Y muchísimo más barato que cualquier otro modelo comercial.
Y ya si hablamos de lo que costó entrenarlo... por eso Meta, "closedai" y demás están cagados, porque no pueden conseguir algo igual o mejor y porque no pueden justificar, ni de lejos, la cantidad de recursos (humanos, eléctricos, GPUs, etc) que utilizan.
De hecho lo más interesante que tiene Deepseek no es el modelo en si (que ya es mucho decir), sino que han liberado la metodología que utilizaron para pasar de Deepseek V3 a Deepseek R1, hablando mal y pronto, sale más barato tomar las salidas de un modelo de razonamiento como R1 y usarlas para entrenar a un modelo como Ollama y Qwen por ejemplo y convertirlos en modelos razonadores, que tratar directamente de crear un modelo razonador a partir de los modelos ya existentes.
que #3 tenga tantos positivos es una muestra del nivel que tiene menéame hoy en día.
El bipartidismo norteamericano es de todo menos democrático, y un lado no se puedi hablar de Tiananmen y en el otro del genocidio Israelí.
Buen intento, pero no es cierto lo que dices
No me gustan ninguno de los dos países, pero tengo amigos españoles que están aprendiendo mandarín y no conozco a nadie español que quiera irse a EEUU.
¿Quieren aprender chino? Que no se confundan, que lo mismo necesitan aprender cantonés
Si hay tanta corrupción como dices, no sería tan difícil que se me tuviera en cuenta
Claro, el problema es la IA china porque las otras, como ChatGPT, nunca se van a usar para nada malo, los capitalistas occidentales no hacen esas cosas.
www.xataka.com/empresas-y-economia/openai-prometio-que-su-tecnologia-n
Pero la peor. No hay nadie peor que él.
Aún así los benchmarks siguen dando vencedor a gpt4 es bastante más caro por token
Contra mas Open Source mejor, sobre todo para Europa que vamos años por detras.
www.meneame.net/m/tecnología/deepseek-afirma-modelo-razonamiento-supe
www.meneame.net/story/bombazo-deepseek-sacude-despilfarro-500-mil-mill
www.meneame.net/m/Mnm/china-sigue-pisando-acelerador-ia-demuestra-nuev
Y si el gobierno español es espabilado deberían entrenar Alia de una forma similar.
A tener en cuenta que si queréis hacer un trabajo pal cole sobre Tiananmen no la utilicéis, en las tres noticias sobre lo mismo anteriores había meneantes enfadados por ello.
Creo que todo esto puede plantear serias dudas también acerca de cuán efectivo es el tecnofeudalismo este de los americanos.
Repito: esto es una iniciativa privada.
¡Y tanto que me jode! No por el avance de la IA, que siempre es impresionante, sino por lo que implica en términos de competencia global y cómo podrían usarlo. Está claro que los chinos no pierden el tiempo, y esto sube la apuesta en la carrera tecnológica.
Por un lado, mola ver cómo optimizan recursos y logran algo tan avanzado con una fracción del coste, pero por otro… ¿qué tanto control tendrán sobre cómo se usa esa tecnología? Siempre queda esa incertidumbre. ¿Tú cómo lo ves? ¿Te preocupa o lo ves como un reto más para el resto del mundo?
DeepSeek ha revolucionado el sector de la inteligencia artificial al desarrollar modelos de lenguaje de alto rendimiento, como DeepSeek-V3 y DeepSeek-R1, que igualan o superan a ChatGPT en diversas tareas, con un coste de desarrollo significativamente menor. Aquí se desglosan los aspectos clave de este avance:
1. Coste reducido: 7% del gasto de ChatGPT
Inversión comparativa: DeepSeek entrenó su modelo V3 con solo 5,6 millones de… » ver todo el comentario
Y tengo que volver a probar el modelo instalad locamente. Eso lo haré entre semana.
Lo caro parece ser procesar el modelo mayor (la punta de lanza) luego a partir de él generar uno algo más optimizado o mejor entrenado parece ser mucho más barato, dando unos resultados similares o ligeramente mejores.
Pero el salto cualitativo aparentemente y de momento, se hace procesando muchos datos y poniendo mucha pasta en hardware.
* Para los usuarios está genial estos modelos baratos.
La trampa sería esconder el modelo y su procedencia (que son textos/imagenes de internet de todos los humanos) y mantenerlo oculto como propietario como hacen openia, gemini, amazon... para sacar dinerines por su uso.
En usar un modelo generativo superior para que te dé los datos de entrenamiento.
www.meneame.net/story/deepseek-afirma-modelo-razonamiento-supera-o1-op
Por cierto. Piden suscripción para leerlo.
- El I+D se lo hacen otos
- Tiene una ingente cantidad de ingenieros/mano de obra/materiales para producir productos/servicios basados en ese I+D
- Tiene el mercado económico más grande del mundo (el propio) que además está bastante blindado a empresas extranjeras donde puede probar y engordar esos productos y servicios
- Puede exportar a gran parte del mundo esos productos/servicios sin tener apenas aranceles (algunos de la UE/USA en poquísimos sectores)