DeepSeek sacudió los cimientos de la IA porque, en teoría, se trataba de un LLM muy avanzado que había tenido un coste total de solo 6 millones de dólares. Suena bien, quizá demasiado bien para ser verdad, y los datos de un estudio compartido por SemiAnalysis han confirmado que todo ha sido una mentira que nos hemos querido creer. El estudio que han elaborado parte de una clave tan básica como importante, el coste del hardware necesario para entrenarla. Para sacar adelante ese entrenamiento se utilizaron GPUs NVIDIA, concretamente ... | Más
#1
Por eso caen una semana después del anuncio, porque primero no se lo creían hasta que hubo evidencias que era cierto.
Las bolsas no caen porque una empresa desconocida china diga que ha superado a las grandes en eficiencia en el desarrollo de IAs
Salir con un titular que afirma rotundamente que "DeepSeek ha engañado al mercado de la IA" es un poco aventurado.
Aproximaciones no son especulaciones.
Y los titulares ahí están, IA de bajo coste... pues no.
Cc #7
La cuestión es que han mentido, y no por poco.
En serio ?
Te lo repito, no proporcionan ni una sola prueba, unicamente especulaciones
___________
Vía: x.com/elhackernet/status/1886481053738574017
Original en inglés: semianalysis.com/2025/01/31/deepseek-debates/
Rel.: www.meneame.net/search?q=DeepSeek… » ver todo el comentario
Ninguna evidencia de lo que defienden pero eh: "DeepSeek ha engañado al mercado de la IA,"
"Según las últimas informaciones los responsables de esta IA podrían haber robado datos a OpenAI, y habrían entrenado a DeepSeek utilizando lo que se conoce
… » ver todo el comentario
Yo creo q alguien miente.
Y como todos sabemos, esos bloques se destruyen, se pulverizan y no queda ni rastro útil de ellos al finalizar el entrenamiento. Ese hardware no podrá utilizarse para nada más en adelante
"coste operativo de mantener y utilizar esos bloques, que sería de unos 944 millones de dólares" calculados de los costos en USA porque como todos sabemos los… » ver todo el comentario
Y lo ha hecho publicándolo en su paper, por lo que la semana siguiente todas las empresas del mundo ya estaban usando este nuevo método.
por cierto no veo contabilizado los buenos salarios de los 200 ingenieros en plantilla.
El hito es pulverizar el coste de preentrenar (y escalar) el modelo y ese son 5 millones que dejan al costo token en marginal.
Si es que se veía venir
Ay esos meneantes fans del grafeno , baterías milagrosas y IAs de bajo costes en sus Xiaomis …
Siempre han sido muy claros, hablaban del coste del entrenamiento.
www.hp.com/co-es/shop/hpconnect/tech-takes/virus-informaticos-mas-dest
Mydoom – 38 mil millones de dólares
Sobig – 30 mil millones de dólares
Klez – 19,8 mil millones de dólares
ILOVEYOU – 15 mil millones de dólares
WannaCry – 4 mil millones de dólares
Si comparamos con los daños causados por un huracán:
Huracán Helene con daños por valor… » ver todo el comentario
Lo he estado usando estos días pero al final siempre vuelto a chatgpt. Deepseek a poco que iteres la conversación ya se está quejando de que los servidores no funcionan, tiene leeks ya conocidos de información, le pasas fotos y no funciona. El R1 en local va peor que llama. En fin, demasiado hype