Tecnología, Internet y juegos
8 meneos
54 clics
Cómo DeepSeek lo cambió todo [EN]

Cómo DeepSeek lo cambió todo [EN]

El mayor impacto que DeepSeek ha provocado en la industria es que potencialmente derriba las considerables barreras de entrada para cualquiera que quiera desarrollar su propio modelo de lenguaje (LLM).

| etiquetas: deepseek , ia , ai , china
De alguna manera es como si los programadores actuales redescubrieran los olvidados beneficios de programar ciertas cosas a bajo nivel primando optimizar recursos de hardware y mejorando los algoritmos en lugar de buscar una "productividad" en bruto con varias pesadas capas de abstracción de software por debajo de su código fuente. Lo mismo ha pasado con el moviento de la librería OpenGL a la libreria Vulkan, y han tardado lo suyo en reconocer que OpenGL se parecía más un interprete de BASIC de los años 80 que a un compilador creando código objeto a ras del hardware de las tarjetas gráficas.
#1 Eso pasa con todo, a día de hoy el desarrollo front que es lo que conozco es una auténtica locura, o yo al menos lo veo así, la cantidad de dependencias es asquerosamente inmensa, y eso de que el código fuente por si solo no funcione ya ni hablemos.
#2 Es que cargar una librería js de 1MB para hacer una chorrada de 10 líneas no puede ser jamás buena idea
#4 Pues hay gente que le gusta y por lo que sea lo promueve, alucino, pero es lo que veo, librerías para todo, por ejemplo que se instalen webpack solo por el Hot Reload, cuando es algo que con un poco de conocimiento te lo haces con node vanilla y tirando.
#6 Bueno, una cosa es instalarlo, otra usarlo, y otra usarlo solo para tu propio código.

Webpack no es mala cosa.
#8 webpack es la bomba, pero a mi como desarrollador independiente no me compensa la verdad, de ahí el comentario que hice antes, que hay gente que lo usa para cosas que podrían hacer ellos mismos ahorrándose dependencias que no olvidemos hay que mantener.
#12 Bueno. Hacer lo que hace webpack "a mano" es bastante laborioso....

No creo que valga la pena y no ahorras nada ni obtienes ninguna ventaja.

Otra cosa es que sirvas "de forma tradicional"...
#13 Es que ahí está la historia, en mi caso de webpack no necesito nada, como decía con tener un servidor con hot reload me vale.
#20 Ya, pero el "motor" del modelo no está programado en Python
#21 que entiendes por motor?
Yo que lo máximo que he programado en mi vida ha sido el despertador he sentido bastante curiosidad del por qué chatpgt estaba hecho con phyton, que entiendo que es lenguaje interpretado y de cara a consumir recursos sería como darle un kebab al que está delicado del estómago en vez de darle, yo qué sé.... Una papillita de verduras. (Comentario escrito con palillo y carajillo).
#3 Dudo que el.motor de chatGPT este en Python. Será el frontend
#5 entiendo. Ya avisé del palillo xD
#5 #7 Se puede preguntar directamente a ChatGPT:

Qué lenguajes se usan para programarte?

Para desarrollarme se usan varios lenguajes de programación y tecnologías. Algunos de los principales son:

Python: Es el lenguaje principal para entrenar y ejecutar modelos de inteligencia artificial como yo. OpenAI usa Python para desarrollar la arquitectura del modelo y gestionar el procesamiento de datos.

C++: Se usa en la parte de alto rendimiento, especialmente en la implementación de

…   » ver todo el comentario
#9 O sea, que el motor es C++ y Rust, lo que tiene sentido. Supongo que con eso crearán módulos que luego se usan desde Python.
#10 Suele tener 3 capas: Python como orquestrador, pero lo "pesado" (manipulación de vectores,matrices, tensores, etc) se lo pasa a una librería (en C++) como PyThorch, que a su vez le pasa los cálculos de matrices en lenguaje Cuda a la GPU.
#9 pues no había pensado en ello, gracias
#3 #5. Sospecho que se utiliza Python por simple comodidad al tratarse de un lenguage interpretado de muy alto nivel ("scripting" lo llaman ahora, pero es tan interpretado como el BASIC de los micros de los 80 y los 90) con el que la detección de errores en el código y las modificaciones sobre el código fuente son muy rápidas en comparación con trabajar con lenguajes que requieren de compilaciónes sucesivas en cada revisión del código fuente.

Lo que si puedo confirmar es que el…   » ver todo el comentario
Edit #15. #3 #5. Quise decir que en este caso lo que pretende generarse en un modelo entrenado de IA óptimo. Las particularidades de eficiencia de el lenguage de programación utilizado para entrenar el modelo pueden ser indiferentes. Y sin embargo esas particularidades, en este caso las de un lenguage interpretado de alto nivel, pueden facilitar la labor de los programadores.
#16 Ese modelo tiene que ser llevado a cabo. Qué las instrucciones sean interpretadas o simplemente ejecutadas en código máquina nativo es muy muy relevante (dependiendo de la funcionalidad que se esté llevando a cabo)
#15 Hombre, desde el punto de vista de la velocidad de ejecución de los algoritmos no todo es igual.

Usar C o Python tiene consecuencias muy relevantes
#5 puedes montar y entrenar un modelo neuronal en cualquier lenguaje. Pero si, el Python es de lo mas usado en deep learning

menéame