Silicon Valley se tambalea. Sin embargo, su fundador, Liang Wenfeng, se ha mantenido discreto y su aparición más reciente ha sido en el programa Xinwen Lianbo (Noticias CCTV) de la Televisión Central China. Traducción en #1
Silicon Valley se tambalea. Se está produciendo un cambio sísmico en el dominio de la IA y todas las miradas están puestas en China. En enero de 2025, DeepSeek-R1 -un modelo de inferencia de código abierto de la empresa china de IA DeepSeek- conmocionó al mundo de la tecnología al igualar el rendimiento de primer nivel de OpenAI a una/30 parte del coste de la API, todo ello con una apertura total.
Con sólo 6 millones de dólares, China construyó uno de los mejores modelos de… » ver todo el comentario
#6 Quizas el problema es de base: Sam Altman no se saco la puta carrera y este tio tiene un puto master.
Hay un tema que siempre me deja tocado que es como Musk, Zuckemberg pueden soltar chorradas sin tener un Master, que es el equivalente a sacarse la carrera en Espania. Pero encima como alguien sin ni puta idea de las matematicas detras del entrenamiento en ML, puede llevar una compania con inversores.
Otro tema es que todo esto es simplemente optimizar funciones a ver quien lo hace mas barato. Por ejemplo, nadie habla de redes semanticas o de heuristica.
#27 Mark estudio ciencias de la computación (vamos ingeniería informática) y Elon tiene varias licenciaturas entre ellas si no recuerdo mal dirección de empresas.
"como alguien sin ni puta idea de las matematicas detras del entrenamiento en ML, puede llevar una compania con inversores"
Te diría que el problema de base es más bien que no sabes cómo se estructura una empresa. Dos roles principales de cualquier startup son el CEO (chief executive officer) y el CTO (chief technology… » ver todo el comentario
#30 No... Mark Zukemberg tiene un Bachelor of Science por Harward. No tiene ningun tipo de formacion en la teoria matematica avanzada de ML.
El problema es que ML es como ingeneria Nuclear: o los dos saben de que va el tema y tienen una educacion en Fisica Nuclear o les puede estallar el tema en las narices. El CEO es quien decide en que se mete el dinero: a Altman le han estado diciendo desde hace anios que lo que dice es erroneo desde el punto de vista matematico. Por ejemplo, en ningun… » ver todo el comentario
#43 y que crees que es ese título? es una licenciatura. Son de 4 a 6 años (lo que aquí se conoce como carrera universitaria).
No se bien si estás insinuando que alguien que estudió una ingeniería informática en los 90 (donde no existía el ML como tal y las redes neuronales aún no eran prácticas) y cuya empresa ha sido pionera en ello y ha dado lugar a uno de los frameworks más importantes de ML (PyTorch es de Meta) es un perfil no valido para llevar la compañía.
Un poco de seriedad. Una cosa es que alguien caiga mejor o peor y otra intentar menoscabar.
#44 "y que crees que es ese título? es una licenciatura. Son de 4 a 6 años (lo que aquí se conoce como carrera universitaria)."
No, es un bachelor. No das clases avanzadas que si se dan en MS, o el doctorado.
Lo que no estoy insinuando, si no declarando, es que no vas a competir con alguien que SI tiene formacion matematica avanzada cuando estas hablando de ML. Es como ser un CEO de una compania de Energia Nuclear: o tienes formacion en Fisica Nuclear, o puedes estar diciendo glipolleces.
#33 No. Si vas a meterte en un tema que require conociemientos matematicos avanzados (ML), o tienes un titulo o eres un puto genio/a que ha publico sobre Teoria Bayesiana, Matrices y espacios lineales, o por lo menos sabes hacer derivadas de matrices y cuales son las implicaciones teoricas de SVM. Si no, eres una programadora cojonuda, pero no tienes ni idea de la teoria de ML.
ML tiene tanta matematica detras, que si volviara al 89 le pegaba una colleja a todos los que decian "que pa… » ver todo el comentario
#1 Fueron 500 millones de dólares, no 6. Lo que pasa es que no lo pueden decir porque compraron equipamiento de Nvidia al que legalmente no deberían tener acceso.
#11 6 millones es lo que les costo la inferencia y posterior entrenamiento para el modelo, ellos mismos señalan en sus publicaciones que ese no es el coste total del proyecto, no estas descubriendo nada, ni cambia nada: crear el mejor modelo actual (teniendo en cuenta el coste de inferencia) les ha costado menos que a Sam Altman sus coches deportivos.
Es lo que hay.
#11 Siempre han dicho que son 6 millones de gasto en entrenamiento , luego los periodistas ...
El hardware sí que tuvo una inversión de varios cientos de millones, aunque también he leído que no se compró para este modelo, las h100 ya eran para cualquier modelo de la empresa.
#28 hay bastantes sospechas de haber usado otras tarjetas, pero bueno yo no lo veo tan relevante si al final has conseguido afinar todo y reducir los costes de esta manera.
#11 podés quedarte con el costo, o con el resultado. Es tu decisión.
Pero mientras el mundo se asombra por el resultado, los recursos necesarios para obtenerlos a vos te preocupa cuanto salió.
Deberíamos pensar si Financiala Times no promueve un discurso que tiende a justificar el porqué de un fracaso. Porque esto es el fracaso de un sistema que se decís pionero y exitoso y ahora hay que detener las perdidas en las empresas
Un caso muy similar a lo que está pasando en la industria automotriz, tú mira el costo.. pero la realidad es que se comieron a la industria de 2 continentes de un bocado los chinos
#11 es falso que no tuvieran acceso legalmente a ese hardware. Lo pone en el enlace que tu mismo pones en #12
. The Chinese company said it used only 2,048 NVIDIA chips that could be obtained without violating US export controls, which limit China’s access to the latest products from US chipmakers.
Y también pone en tu enlace que esos supuestos 500 millones son lo que gastaron en toda "su historia", no lo que hayan usado para entrenar este modelo. Y esos 500 millones... la fuente es muy interesada.
#38 No, compraron otros chips que sí violaban los controles de exportación, a través de un intermediario de Corea del Sur. Pero claro, no lo pueden decir.
" Si innovas y abres el código de tus avances -como la innovación de la arquitectura MLA publicada en mayo-, ¿no los copiarán rápidamente los competidores? Liang Wenfeng: En la tecnología disruptiva, los fosos de código cerrado son efímeros. Nuestra verdadera ventaja radica en el crecimiento de nuestro equipo, que acumula conocimientos y fomenta una cultura innovadora. La externalización y la publicación de artículos no suponen pérdidas significativas. El código abierto es cultural, no sólo comercial."
Que hijos de puta los chinos como saben, como han colado su filosofia sobre las pantentes en la entrevista. Traduccion "occidente patenta para obtener beneficios, nosotros obtenemos beneficios sacando mas producto"
Con código abierto también se obtienen beneficios, sino pregúntale Google o a Microsoft que han usado código abierto y contribuido. No sé cuál es el problema de hacer beneficios, explica cuál es el problema?. No es lo uno o lo otro.
Tesla también liberó tecnología patentada en su día.
Osea, me parece cojonudo, pero no vengan a decir que es una "nueva filosofía de la China donde nadie busca beneficios". Un nabo
#19 no, nueva no, es la de siempre. Los chinos nunca respetan las patentes y de siempre dicen que la ventaja del que llega el primero es unicamente haber llegado primero. Que si no aprovechas la ventaja de haber llegado primero, es tu problema.
#20 dales tiempo. En poco les empiezan a molar las patentes.
Además una cosa es la propiedad intelectual y otra el registro de marca, que también se la pasan por el arco y dudo que tengan un razonamiento aceptable.
De todas formas, nada que reclamarles con esto que sacaron de Deep seek. Creo que ganamos más en un mundo de comercio e intercambio libres
#22 De todas formas lo mas gracioso de las patentes es que los liberales britanicos eran precisamente los que echaban pestes de ellas y las llamaban "el impuesto de la corona" cuando empezaron con el tema. En resumen, que las patentes solo les gustan a los que se lucran con ellas.
#24 echando una ojeada a chatgpt, era un tema contencioso entre los liberales clásicos primigenios, no unánime.
Y la verdad tiene razón de ser contencioso. Y creo que la mejor solución es lo que ya tenemos actualmente: que existan pero se liberen tras un tiempo. Y que existan opciones mixtas de registro abierto. Y no queda de otra que cada inventor elija la que prefiera
Si lo que buscas es que una empresa grande y poderosa "no se aproveche" pues valiste, porque igual se aprovecharían usando inventos de otros libremente si no hubieran patentes.
#20 No respetan las patentes, ni normativas de seguridad, sus productos no tienen las garantias que tienen en occidente, los contratos son papel mojado, los derechos laborales no existen, y un largo etc.
A mi particularmente me parece bien que se pongan aranceles a todo lo chino.
#35 Las empresas chinas hacen exactamente lo que los empresarios que las contratan les permiten. Si no queremos "niños esclavos*" trabajando tenemos la obligacion de inspeccionar las fabricas donde mandamos producir, si no les controlamos es porque no queremos saberlo. Que por eso externalizamos, no seamos hipocritas. China mal, india bien y te tienes que reir con la falsa dicotomia.
*Oh sorpresa esto es valido en usa donde el trabajo infantil es legal, en españa donde metemos a ilegales en condiciones de esclavitud en los almacenes escondidos y por supuesto en china/india/sudaficac/inserteaquisuodio.
#26 La china es más divertida. Prueba a preguntarle por caricaturizar a Donald Trump. Luego, cuando responda, prueba a decirle que haga lo mismo con el líder chino.
Liang Wenfeng: Nuestro objetivo principal no era captar usuarios. Redujimos los precios porque, en primer lugar, al explorar estructuras de modelos de próxima generación, nuestros costos disminuyeron; en segundo lugar, creemos que los servicios de IA y API deben ser asequibles y accesibles para todos.
Este señor cree que va a liderar siempre esta competición? Las competencia siempre es buena y esto provocará que aparezcan más modelos open source que traten de usar técnicas innovadoras como las planteadas por su equipo.
Veremos un modelo open source de openAI? O de Grok? Yo espero que si, incluso espero a países de la UE tratando de emular a los chinos y probando cosas nuevas.
Solo espero de verdad que en esta competencia no se les vaya de las manos y controlen siempre mucho la tecnología, porque tiene un potencial tremendo, tanto para hacer el bien como para hacer el mal.
Silicon Valley se tambalea. Se está produciendo un cambio sísmico en el dominio de la IA y todas las miradas están puestas en China. En enero de 2025, DeepSeek-R1 -un modelo de inferencia de código abierto de la empresa china de IA DeepSeek- conmocionó al mundo de la tecnología al igualar el rendimiento de primer nivel de OpenAI a una/30 parte del coste de la API, todo ello con una apertura total.
Con sólo 6 millones de dólares, China construyó uno de los mejores modelos de… » ver todo el comentario
Hay un tema que siempre me deja tocado que es como Musk, Zuckemberg pueden soltar chorradas sin tener un Master, que es el equivalente a sacarse la carrera en Espania. Pero encima como alguien sin ni puta idea de las matematicas detras del entrenamiento en ML, puede llevar una compania con inversores.
Otro tema es que todo esto es simplemente optimizar funciones a ver quien lo hace mas barato. Por ejemplo, nadie habla de redes semanticas o de heuristica.
"como alguien sin ni puta idea de las matematicas detras del entrenamiento en ML, puede llevar una compania con inversores"
Te diría que el problema de base es más bien que no sabes cómo se estructura una empresa. Dos roles principales de cualquier startup son el CEO (chief executive officer) y el CTO (chief technology… » ver todo el comentario
El problema es que ML es como ingeneria Nuclear: o los dos saben de que va el tema y tienen una educacion en Fisica Nuclear o les puede estallar el tema en las narices. El CEO es quien decide en que se mete el dinero: a Altman le han estado diciendo desde hace anios que lo que dice es erroneo desde el punto de vista matematico. Por ejemplo, en ningun… » ver todo el comentario
No se bien si estás insinuando que alguien que estudió una ingeniería informática en los 90 (donde no existía el ML como tal y las redes neuronales aún no eran prácticas) y cuya empresa ha sido pionera en ello y ha dado lugar a uno de los frameworks más importantes de ML (PyTorch es de Meta) es un perfil no valido para llevar la compañía.
Un poco de seriedad. Una cosa es que alguien caiga mejor o peor y otra intentar menoscabar.
No, es un bachelor. No das clases avanzadas que si se dan en MS, o el doctorado.
Lo que no estoy insinuando, si no declarando, es que no vas a competir con alguien que SI tiene formacion matematica avanzada cuando estas hablando de ML. Es como ser un CEO de una compania de Energia Nuclear: o tienes formacion en Fisica Nuclear, o puedes estar diciendo glipolleces.
ML tiene tanta matematica detras, que si volviara al 89 le pegaba una colleja a todos los que decian "que pa… » ver todo el comentario
Es lo que hay.
El hardware sí que tuvo una inversión de varios cientos de millones, aunque también he leído que no se compró para este modelo, las h100 ya eran para cualquier modelo de la empresa.
El tiempo dirá de cualquier manera.
Pero mientras el mundo se asombra por el resultado, los recursos necesarios para obtenerlos a vos te preocupa cuanto salió.
Deberíamos pensar si Financiala Times no promueve un discurso que tiende a justificar el porqué de un fracaso. Porque esto es el fracaso de un sistema que se decís pionero y exitoso y ahora hay que detener las perdidas en las empresas
Un caso muy similar a lo que está pasando en la industria automotriz, tú mira el costo.. pero la realidad es que se comieron a la industria de 2 continentes de un bocado los chinos
. The Chinese company said it used only 2,048 NVIDIA chips that could be obtained without violating US export controls, which limit China’s access to the latest products from US chipmakers.
Y también pone en tu enlace que esos supuestos 500 millones son lo que gastaron en toda "su historia", no lo que hayan usado para entrenar este modelo. Y esos 500 millones... la fuente es muy interesada.
mezha.media/en/2025/01/29/analysts-say-that-deepseek-spent-well-over-5
Vamos a llegar a la AGI en un periquete
O quizá más bien que les han hecho un mate pastor los chinos a los gringos.
Que hijos de puta los chinos como saben, como han colado su filosofia sobre las pantentes en la entrevista. Traduccion "occidente patenta para obtener beneficios, nosotros obtenemos beneficios sacando mas producto"
en.m.wikipedia.org/wiki/History_of_free_and_open-source_software
Con código abierto también se obtienen beneficios, sino pregúntale Google o a Microsoft que han usado código abierto y contribuido. No sé cuál es el problema de hacer beneficios, explica cuál es el problema?. No es lo uno o lo otro.
Tesla también liberó tecnología patentada en su día.
Osea, me parece cojonudo, pero no vengan a decir que es una "nueva filosofía de la China donde nadie busca beneficios". Un nabo
Además una cosa es la propiedad intelectual y otra el registro de marca, que también se la pasan por el arco y dudo que tengan un razonamiento aceptable.
De todas formas, nada que reclamarles con esto que sacaron de Deep seek. Creo que ganamos más en un mundo de comercio e intercambio libres
Y la verdad tiene razón de ser contencioso. Y creo que la mejor solución es lo que ya tenemos actualmente: que existan pero se liberen tras un tiempo. Y que existan opciones mixtas de registro abierto. Y no queda de otra que cada inventor elija la que prefiera
Si lo que buscas es que una empresa grande y poderosa "no se aproveche" pues valiste, porque igual se aprovecharían usando inventos de otros libremente si no hubieran patentes.
A mi particularmente me parece bien que se pongan aranceles a todo lo chino.
*Oh sorpresa esto es valido en usa donde el trabajo infantil es legal, en españa donde metemos a ilegales en condiciones de esclavitud en los almacenes escondidos y por supuesto en china/india/sudaficac/inserteaquisuodio.
Veremos un modelo open source de openAI? O de Grok? Yo espero que si, incluso espero a países de la UE tratando de emular a los chinos y probando cosas nuevas.
Solo espero de verdad que en esta competencia no se les vaya de las manos y controlen siempre mucho la tecnología, porque tiene un potencial tremendo, tanto para hacer el bien como para hacer el mal.