Los ingenieros de DeepSeek han decidido utilizar PTX para sacar el máximo partido posible a las GPU H800 Una de sus estrategias ha consistido en asignar solo 20 SM de cada GPU a la comunicación entre los servidores
|
etiquetas: deepseek , nvidia , ia
Para hacer un programa puntual puedes salir al paso con cualquier lenguaje. Pero cuando haces algo que se va a ejecutar en millones de dispositivos la eficiencia es fundamental.
Si lo que buscas es rendimiento, ensamblador + C.
Es por si me pongo con ello o paso
Te explica hasta que librerías OpenSource utiliza
"Mi núcleo y las partes más críticas de mi funcionamiento están implementados en C/C++, ya que estos lenguajes ofrecen un mayor control sobre el hardware y un rendimiento optimizado, lo cual es esencial para tareas intensivas como el procesamiento de lenguaje natural (NLP) y el manejo de grandes volúmenes de datos. Sin embargo, las capas más externas y las interfaces de programación suelen estar escritas en Python, ya que es más flexible y fácil de usar para integrar
… » ver todo el comentario
Preguntandole más detalles:
A continuación, te proporciono una lista de los lenguajes de programación que se utilizan comúnmente en el desarrollo de modelos de inteligencia artificial como yo, junto con una estimación aproximada del porcentaje de uso de cada uno. Ten en cuenta que estos porcentajes son estimaciones y pueden variar según el proyecto y el equipo de desarrollo:
Python (~70-80%):
Python es el
… » ver todo el comentario
En los desarrollos que yo hago la diferencia de velocidad de C y Pyhton es bestial. Digamos que para la misma cosa C la hace en 20 minutos, y Python en alrededor de 32 horas.
Cada lenguaje debe ser usado en su ámbito. El lenguaje C no está diseñado para desarrollar la capa de funciones de IA.
Y DeepSeek no dice que se use C, sino C++ y Rust
la realidad es que mayoritariamente se usa Python, salvo para las parte que la eficiencia de C++/Rust es necesaria.
C/C++ se compilan: es decir, cuando generas el .dll, .exe o .so o el ejecutable que sea, generas codigo objeto directamente optimizado para el procesador o arquitectura en cuestion.
En Python y otros lenguajes interpretados o que requieran una maquina virtual, es la maquina virtual la que va traduciendo las instrucciones al hardware segun va ejecutandose el codigo y por ello es mas lento y menos eficiente que C/C++...
Es mas, en codigo C++ puedes meter desde codigo de alto nivel (lambdas, variables auto, smart pointers, etc) hasta de bajo nivel como ensamblador especifico para una arquitectura concreta y compilarlo...
Asi que no, no es lo mismo interpretar que compilar...
La realidad es el lenguaje más usado para programar IAs es Python, salvo algunas partes de infraestructura que necesitan lenguajes de más bajo nivel.
C++ moderno me refiero... la libreria STL ha introducido infinidad de nuevas historias de alto nivel: smart pointers, lambdas, variables auto, bucles for y foreach mejorados, etc etc etc... y sigues teniendo el acceso a bajo nivel de siempre o usar cosas de C pero aprovechando la Orientacion a Objetos. Asi que C++ es el lenguaje mas completo de hoy en dia...
Pero el lenguaje usado en la IA es mayoritariamente es Python. Y lo usan todos, sean occidentales o chinos.
repetir algo 20 veces no es argumentar
Tu problema es que solo sabes C, un lenguaje viejuno, y quieres creer que podrías estar en el sector de moda que es la IA.
No es así. Empresas como Google son capaces de desarrollar en cualquier lenguaje, incluso desarrollan lenguajes nuevos cuando lo necesitan. Y utilizan Python para desarrollar la IA.
En Google trabajan algunos de los padres de la IA generativa, saben más del tema que todo MnM junto.
www.meneame.net/story/verguenzas-propaganda-putin-descubierto/c024#c-2
www.meneame.net/story/estados-unidos-israel-profundizaran-colaboracion
Samay, AlvaroVicente, Seid, Bierce, Juancadiz,… » ver todo el comentario
Joder ! Qué seguimiento le has hecho !
Sí, soy uno de los que sobrevivieron a eso
Por otra parte, y esto es una opinión personal, el problema no es tanto el uso de lenguajes de medio nivel como c/c++ como el uso de Wrappers para usar lenguajes de alto nivel en vez de c/c++, y así avanzar mas rápido pero a costa de una mayor cantidad de proceso.
"Por medio de wrappers se puede usar Python, Fortran, Julia y Java en vez de C/C++."
es.wikipedia.org/wiki/CUDA
No. Cuando un software se va a ejecutar en millones de dispositivos lo fundamental es la compatibilidad de la aplicación con los diferentes dispositivos. Sin eso no tienes nada.
Ni siquiera sabes lo que es un falso dilema.
Yo soy responsable de lo que digo no de lo que tu entiendas.
Que es importante: Si. Que es fundamental, no. Fundamental es que sea compatible.
Usar lenguajes de mierda como el Python, es el problema por eso DeepSeek les ha dado una hostia en toda la cara ChatGPT y demás.
Python es como el BASIC (Beginners' All-purpose Symbolic Instruction Code) de los 80, un lenguaje malo, ineficiente e interpretado. Pero muy popular para que muchos programadores mediocres se crean que saben programar. Pero en una situación de crisis energética, de dispositivos que… » ver todo el comentario
… » ver todo el comentario
Destilas superioridad hasta por las orejas.
Habra que decir a los de wikipedia o wordpress que la hagan en c en vez de en PHP que sino son empresuchas.
O Pinterest, Dropbox, spotify, Netflix, Uber, Reddit, Google, Youtube que dejen de usar python que sino son empresuchas
Te piensas tú que no se pueden hacer chapuzas en ensamblador ...
Otra cosa es que se hagan programas en alto nivel cuya optimización es cero o inferior ...
Lenguaje duro de pelotas y que para todo, te tocaba la nariz el vocado de pila.
Si lo han usado hoy en día, mis alabanzas a los tipos, porque tela marinera el lenguaje de marras.
En vez de valorar lo que han hecho y ver si es replicable para ahorrar un pastizal se prefiere mentir tergiversar o inventar.
Pero no es la primera vez ni la ultima.
La realidad es que una cosa es lo que se dice y otra lo que se hara si es replicable el salto para todos con los mismos recursos sera visible en relativamente poco tiempo.
Aún así, es cierto que mientras no se explica al público lego y alejado de los papers parece que fuera un oscuro secreto misterioso.
Microsoft ya ofrece la IA de Deeseek como servicio.
Las redes sociales no son la realidad. Hay mucha gente sería en la industria de IA en EEUU.
Y de un plumazo ponen a OpenAI en la casilla de salida
Botijo, convierte este código CUDA a código PTX y optimiza al máximo su rendimiento.
E ya.