Con modelos como DeepSeek R1, diseñado para ser más barato y eficiente que ChatGPT, y el multimodal Janus Pro 7B, la compañía no solo ha desbancado a OpenAI, sino que también ha puesto en jaque la demanda de GPUs de alto rendimiento. Sin embargo, el éxito de DeepSeek está entrelazado con un reto crucial: su dependencia de hardware basado en modelos anteriores de Nvidia, como los chips A100 y H100, y las restricciones impuestas por las tensiones comerciales entre Estados Unidos y China.
|
etiquetas: deepseek r1 , janus pro 7b , nvidia , caída en bolsa , modelos a100 , h100
Estoy seguro de que, mientras van montando sus fábricas de chips avanzados cual hormiguitas silenciosas, prefieren tener muchos (y muy baratos, escalables y fácilmente sustituibles) ejércitos de 4090 petadas de memoria (en Reddit se han visto mods que son putos mostrencos...) que esos A100 y H100.
Mirad DeepSeeker R1 y lo que les ha costado entrenarlo con las supuestas restricciones que tienen...
Está claro que la gente no entiende ni sabe lo que está pasando:
China compra las tarjetas "capadas" por USA para la IA, a TONELADAS, las envía a fábricas propias y las modifica para liberarlas y DOBLARLES e incluso TRIPLICARLES la cantidad de memoria que tienen como producto comercial. Con lo que, al final, acaban con tarjetas MÁS potentes que las originales que se venden en los propios USA.