Cómo instalar DeepSeek para usarlo de forma local en tu ordenador Windows, macOS o GNU/Linux

267 meneos

5411 clics

Cómo instalar DeepSeek para usarlo de forma local en tu ordenador Windows, macOS o GNU/Linux

Vamos a explicarte cómo instalar DeepSeek en tu ordenador, para poder utilizarlo cuando quieras. Hay varias maneras de hacerlo, pero nosotros vamos a intentar recurrir a una de las más sencillas que sean posibles, y que funcione tanto con Windows como con macOS y GNU Linux. Para eso, vamos a recurrir a un programa que se llama Ollama, y que sirve para poder instalar distintos modelos de inteligencia artificial y lanzarlos en tu ordenador. Entre ellos está DeepSeek. Se instala como una aplicación normal, aunque su utilización es un poco...

125 142 5 K 474 tecnología

97 comentarios

125 142 5 K 474 tecnología

Comentarios destacados:

#36 Marchando un erronea por insistir en montar qwen y llama 3.3 y llamarlos deepseek por el ajuste fino.

Ollama no puede correr aun Deepseek, es un model de 600 gigaparametros y todavia no han subido las cuantizaciones a 2 bits huggingface.co/unsloth/DeepSeek-R1-GGUF que es lo unico que podrias ejecutar en una sola maquina.

#2 tul

acabo de probarlo con lm-studio, en 3 clicks corriendo, lmstudio.ai/beta-releases

8 87

#5 pkreuzt *

LM-Studio, el que menciona , es un instalador para múltiples modelos. Lo hay en AppImage.

0 10

#6 tul

en el enlace que he puesto esta la beta de la ultima version en .AppImg y en .deb (ademas de las versiones para windows y mac)

0 11

#7 dark_soul

No lo conocía pero cuando hablo de snap o flatpak es por qué son jailroot (es el mejor término que se me ocurre para describirlo) para las app que instalas en tu so

0 7

#8 pkreuzt

La gente suele usar mas bien AppImage porque es más portable y no requiere absolutamente nada instalado previamente. Pero si eres un poco paranoico, se recomienda usar conjuntamente con FireJail.

0 10

#11 dark_soul

más cosas nuevas. Soy usuario de Linux y uso Gnome. Solo conozco flatpak y snap.

0 7

#74 MFC2K7

Sigue teniendo filtros de moralidad, no puedo hacer según que preguntas, no le veo utilidad. Para eso sigo usando servicios online.

0 7

#36 arivero

Marchando un erronea por insistir en montar qwen y llama 3.3 y llamarlos deepseek por el ajuste fino.

Ollama no puede correr aun Deepseek, es un model de 600 gigaparametros y todavia no han subido las cuantizaciones a 2 bits huggingface.co/unsloth/DeepSeek-R1-GGUF que es lo unico que podrias ejecutar en una sola maquina.

9 70

#43 ralph

Es increíble cómo la mentira esa sigue viva! y cada vez más!

Me estoy cagando en ollama mucho!

2 25

#48 llorencs

El de 671B se puede bajar. Pero obviamente no tirará bien en ninguna maquina normal, ni siquiera en estaciones de trabajo que no monten como mínimo A-100.

2 38

#72 arivero

Ah, ahora veo que ya lo tienen. Voy a ver si de verdad funciona...

0 9

#85 arivero

Pues de momento con 4 H100 y 1 tera de RAM no chuta. Seguramente lo han probado -si es que lo han probado- en alguna configuracion de 8 GPUs sin hacer descarga a la cpu.

0 9

#67 Grub *

"Ollama no puede correr aun Deepseek"
FALSO. Al menos he visto un par probando la versión 14b (y yo la 32b funcionando)
(en un A10 24G VRAM)

0 9

#71 arivero

Y si yo entreno el ALIA con los <think>de Deepseek, ¿pasa a ser un Deepseek R1? Pues segun los de ollama, si. No se, a mi me parece que a un llama 3.3 con el chink hay que seguir llamandolo Llama y no "deepseek 70B"

Deepseek R solo tiene un modelo, el de 671B. Que cabe en una maquina con un tera de RAM pero muy rapido no va a ir (luego te digo). Han sacado versiones cuantizadas ya los que suelen hacer los GGUF, pero esas no son las que tienen ahi.

1 13

#75 Grub

La cuantizada de Phi (Microsoft) se llama Phi_Qx y la cuantizada de Llama (Meta) Llama_Qx.
Te molesta, pues lo haces privativo como OpenIA. Evitas confusiones y ni siquiera tienes que dar explicaciones.
Si no te gustan los GGUF para uso local en PC, no los uses. Es sencillo pero déjanos vivir un poco.

0 9

#86 arivero

No se como lees que me moleste. Lo que quiero decir es que no nos hagamos trampas al solitario diciendo que "ya me funciona deepseek". Yo solo he conseguido ejecutar con vLLM el modelo sin cuantizar, en 12 GPUs, y con llama.cpp en 4 GPUs las cuantizaciones gguf que ha hecho unsloth y que hace 15 minutos todavia no estaban en ollama.

Tu has conseguido ejecutar Deepsek R 671, en alguna cuantizacion?

1 18

#87 Grub

NO. Solo he probado y me han funcionado las de Ollama y gguf.
Se pueden alquilar GPUs en asía pero no tengo interés en modelos enormes. No necesito los LLMs a ese nivel. Para tonterías pago por la API de DeepSeek (que estaba caída hace unas horas, no sé ahora). He visto por twitter un vídeo con 3 Apple M1 petados de RAM haciendo pruebas y parecía real. Ni idea!

Seguro que hay un montón de gente haciendo su trabajo y en unas horas...

0 9

#78 llorencs

Simplemente se ha creado el nuevo modelo con el sistema maestro-alumno. Así que es una técnica para que ese modelo tenga las funcionalidades del maestro pero con un tamaño menor.

Para la mayoría de expertos ese modelo alumno lo suelen considerar un modelo menor del mayor.

0 10

#20 orangutan

La cuestión no es cómo instalarlo, sino qué hardware necesitas

5 58

#44 ralph

Lo dicho, errónea.

NO es deepseek-r1, son "destilados".

A ver si la peña se entera de una vez que "ollama" ha estado mintiendo y que casi nadie está corriendo Deepseek-r1 en modo local! (se puede, pero se necesita un equipo con muchísima RAM/VRAM).

3 32

#49 llorencs

Un destilado es un método que más o menos proporciona un rendimiento parecido al modelo grande. Sí que es una mejora sobre un llama o un qwen normal.

0 10

#88 Kr0n0

La verdad si que es curioso que lo pongan con tags directos de deepseek-r1:XX en vez de los que correspondería de los distilled. Hay que entrar en la ficha de ollama para verlo: ollama.com/library/deepseek-r1
Para ver requisitos aproximados de VRAM y demás, mejor buscar por el modelo con el nombre completo (DeepSeek-R1-Distill-Qwen-XX o DeepSeek-R1-Distill-Llama-XX según la web de ollama).
Hay tablas como nodeshift.com/blog/a-step-by-step-guide-to-install-deepseek-r1-locally para poder contrastarlo.

0 6

#46 llorencs *

Yo uso la 70b en una GPU de 40 GB y va lentita. Tengo que mirar los tokens que saca.

1 25

#26 NPCmasacrado

Funciona en local através de ollama, igual no has entendido que ollama no pasa los datos a nadie

1 23

#30 carademalo

Quizá per se no, pero se puede hacer con ngrok, open-webui o incluso scripts en Python.

0 11

#54 tdgwho

Windows no es un programa de código abierto.

Ollama si.

Y deepseek r1 también.

1 20

#24 este_no_es_eltraba

Solo 5 gigas???? Como es posible?

1 19

#28 sotillo

Milagro, milagro

2 29

#34 tdgwho

Porque es un modelo pequeño.

Imagina que tienes el ferrari de leclerc, puedes cambiarle los neumaticos por unos de calle, quitar el motor y poner uno de calle, quitar la caja de cambios... etc.

Sigue siendo el ferrari, tiene su aero y tal, pero no rinde igual.

El modelo r1 son 671B de parámetros y ocupa unos 400gb, pero se ha conseguido entrenar modelos como llama y qwen que son mas pequeños (1.5 7 8 14 32 y 70B) usando prompts de deepseek r1.

esto los mejora un huevazo, y además son mas "portables". Siendo los modelos que casi todo el mundo puede montar los de 7 8 o 14B (4,5 a 10gb de ram)

4 46

#41 ralph

Porque es mentira.
NO es deepseek-r1, es un "destilado" de otros modelos con algunas instrucciones de deepseek.

Puto ollama y sus nombres erróneos.
Que ya dudo si lo hicieron a propósito... para que la gente los prueba y diga "pero si es una mierda...!", cuando NO están corriendo deepseek-r1 sino los "destilados".

3 36

#55 aritzg

Efectivamente. Son llama's y qwen's re-entrenados con R1. También está el modelo R1 original con "capacidad de razonar" pero ese no rula en el 99'9% de PCs

0 10

#58 DiThi

Sí que se puede porque 1. el entrenamiento también incluye datos fiables de tianmen y taiwan, y 2. hay diversas técnicas de quitar censuras de un modelo.

1 19

#69 Enero_2025

Ok, gracias. ¿Puedes darme más información del segundo punto? Me interesa.

0 10

#76 DiThi

Hay varias formas de quitarle censura a modelos. Una es entrenarlo con el tipo de datos que quieres que dé, y otra es con una técnica llamada "abliteration" que básicamente identifica los pesos que provocan la respuesta censurada y los anula. Es algo así como cortar aquellas conexiones neuronales que se activan exclusivamente durante una respuesta censurada y no durante cualquier otro tipo de respuesta.

1 19

#83 Enero_2025

Gracias

0 10

#84 JanSmite

Yo lo tengo montado sobre freshkill en un groar de 24b, pero con una 4060.

Mi contenedor es un gibernetes sobre una vm en un AWS de deckchart, y, sí, también va bien.

^{_{^{_{Yo también sé decir palabrejas…}}}}

0 18

#92 mirav

por dos razones principalmente.

En primer lugar estoy montando una aplicacion que entre otras cosas extrae determinada informacion de fotografias. Las aplicaciones que transforman el tipo de imagenes que transformo cobran mucho por imagen analizada.

Ademas tengo una instalacion domotica de home assistant que es controlable por voz y tiene detectores de presencia y camaras. Es lo ultimo que quieres exponer en internet... En cualquier caso paso de dar datos personales a ClosedAI o similares.

1 18

#17 Razorworks

¿Como irá esto en una Nvidia P40 de 24GB, y se la pongo a mi servidor?

1 18

#37 O.OOЄ

Pero no seas así de pobre...

2 29

#39 mirav

Veo esos gb de vram libres y me dan ganas de llorar

5 52

#42 woopi *

¡Y yo con el cluster de las Casio fx-850p!

1 20

#95 mcfgdbbn3

: Yo pongo mi Arduino UNO.

0 11

#70 Grub *

Mira imagen de ... Unos 2000/3000 eurillos cada GPU (no he mirado precios)
A mi con una de esas (prestada) me va lento de cojones. Unos 20 tokens/segundo con 32b.

Pero el modelo de 14b funciona bastante bien en una Nvidia de 8Gb. (tb unos 30 tokens)

2 29

#73 SergioZgz

Que asco y envidia me das....

0 9

#89 Sandler

quién las pillara...

0 9

#97 Jakeukalane

jiji

0 10

#38 mirav

yo lo estoy usando con el distill de 32b de qwen en un server con una 3090

root@ollama-76c84b4ffd-km65z:/# ollama list
NAME ID SIZE MODIFIED
deepseek-r1:32b-qwen-distill-q4_K_M 38056bbcbb2d 19 GB 2 days ago

es un contenedor kubernetes montado sobre una vm montado sobre un cluster proxmox. Y VA COMO UN TIRO

1 18

#61 emdi

Lo tuyo es vicio....No hay contenedor LXC para proxmox?

0 10

#64 mirav

se puede ejecutar en docker directamente, hay imagenes con ollama o incluso con ollama y openwebui (interface web) disponible. ahi te bajas el modelo (ollama pull deepseek-r1:32b-qwen-distill-q4_K_M) y a jugar

0 9

#82 emdi

Lo decía para evitar un VM con docker. Vamos, ejecutar un LXC directamente sobre proxmox.

0 10

#80 gilipipas

Por curiosidad, para qué lo usas?

0 9

#81 FooDev

Esa es la pregunta que siempre hago y... Hasta ahora nadie me ha dado una razón convincente. Para mí, reconociendo que los avances son impresionantes, para el usuario convencional no tiene nada que ofrecer. Fuera de ciertos sectores es todo humo.

0 7

#90 navi2000

¿La posibilidad de generar texto y código en local no te parece suficiente? Piensa que muchas empresas no permiten usar herramientas de IA generativa en la nube porque implica que los datos salen del control, pero en local todo queda en casa y no hay filtraciones por esa vía. Ah! Y el coste, que si ya dispones del hardware (no tienes que comprar nuevas tarjetas para soportarlo) resulta marginalmente bajísimo.

Pero si eso te parece poco, se pueden crear fine-tunes y ajustar parámetros de una manera que en otros escenarios resultaría imposible o muy costoso.

0 10

#91 FooDev *

¿La posibilidad de generar texto y código en local no te parece suficiente?

¿Para qué? ¿Con qué finalidad?

La generación de código está claro que es una de las vías más claras. Pero para al usuario convencional, que usa el ordenador para consumir contenido ¿qué le aporta?

0 7

#93 navi2000

Para que los datos de tu empresa se queden en tu empresa. ¿No has leído las noticias de filtraciones de datos debido a que se usaron para crear prompts para chatGPT?

Y hablo de empresas porque son los early adopters en este caso. Los consumidores finales tienen el mismo problema, pero no lo saben.

0 10

#35 montag

Relacionada: es.wikipedia.org/wiki/Caballo_de_Troya

2 12

#53 Bernard

Mayor que Google no creo que sea

1 18

#59 este_no_es_eltraba

es de coña, la gente con aplicaciones occidentales con backdoors a saco y ahora os preocupan los chinos.....

Mira, prefiero que me espie china que occidente.

2 17

#96 Trigonometrico

Vaya ¿igual que el Windows?

0 10

#40 Richaldor *

Estaba probándola porque no paro de ver a gente hablando de que está censurada y parece ser que sí.

He preguntado como decían sobre Tianamén y soltó un párrafo diciendo en plan que China ha hecho siempre lo mejor para su país y sus ciudadanos.

Al cabo de unos segundos se borró el mensaje solo y se cambió por:
Sorry, that's beyond my current scope. Let's talk about something else.

Le he hecho luego un par de consultas sobre programación y no lo ha hecho mal.

Pero esto de que las IA modulen… » ver todo el comentario

0 11

#45 Enero_2025

No, no se puede porque el modelo está entrenado así.

0 10

#56 mecha

si que hay censura sobre este tema en DeepSeek, como también los tiene chatgpt sobre otros muchos. Acostumbrate a que la IA venga con ciertas ideas grabadas a fuego, evita informarte de temas delicados usándolas.

En cualquier caso, está noticia no va sobre DeepSeek, es un bulo.

0 8

#66 U5u4r10

chatgpt hace lo mismo con otra cosas, pero lo de deepseek es muy cantoso

0 9

#79 aironman

Acho,

Brew install ollama
ollama RUN deepseek-5b

Y ya.

0 10

#57 Lerena

La RAM de sistema no influye en nada? Yo tengo 32 GB de RAM y una gráfica con 8Gb.

0 10

#68 Grub

Solo con la RAM / CPU funciona bien con los modelos de 4Gb (7b).
Pero te puede dar 3 o 4 palabras por segundo. Cuanto tu velocidad de lectura es mayor, suele ser molesto.
- Con 8Gb de gráfica, no deberías tener problemas (unas 20 palabras segundo lo considero bastante rápido)

0 9

#19 carademalo

Titular alternativo: "Cómo añadir a tu ordenador un RAT para el gobierno chino".

2 9

#22 NPCmasacrado *

En local no mandas datos a los chinos y menos através de ollama

1 23

#25 carademalo

Que algo funcione en local no significa que no tenga acceso a Internet "para otros menesteres".

1 22

#31 tdgwho

Ollama funciona sin conexion...

0 10

#52 mecha

no digo que lo haga, y además no lo creo porque sería un poco absurdo, pero mi Windows funciona en local perfectamente, sin necesidad de tener una conexión a internet, y cada vez que conecto el wifi empieza a mandar datos. Esto por poner un ejemplo cualquiera.

0 8

#23 bibubibu

Te faltó añadir: "junto al RAT para el gobierno usano".

4 37

#27 sotillo

Ahora mismo ¿ Tú quién crees que es mejor, que lo tengan los yankis que creen que somos del BRCIS o de los chinos que están muy lejos?

0 11

#51 turuleto

Aunque has evitado decirlo, tu pregunta realmente es: ¿ Tú quién crees que es mejor, que lo tengan los yankis que creen que somos del BRCIS o de los chinos que son el BRICS?

0 12

#4 dark_soul

Tiene buena pinta pero me esperaré a que salga una versión en snap o flatpak para probarlo

0 7

#12 wachington

Yo que no entiendo mucho de informática me esperaré a que salga la película.

15 115

#14 dark_soul

correcto

3 29

#29 Elektr0

Yo prefiero el libro y a ser posible en edición de bolsillo

1 13

#47 noloquiero

Yo soy más de la edición coleccionista, que seguro que luego se puede vender por una pasta

0 9

#50 joffer

De eso se trata. Por lo visto con Deepseek es posible tener una edición de bolsillo de gran potencia.

0 11

#16 ColaKO

El año de Linux en el escritorio...

0 9

#65 mecheroconluz

¿Snap es el nuevo sistema de paquetes de los programas en Linux o me confundo?

0 10

#77 dark_soul

lo que se dice nuevo... Creo que Ubuntu lo incluyo hace muchas versiones

0 7

#60 Gergo

Al gobierno chino le encanta esto.

0 6

#94 alfinal

¿Por qué?

0 10

#1 skout

» ver comentario

34 -150

#3 Marisadoro

Mejor pregúntaselo a DeepSeek.

10 95

#9 perogrullobrrr *

RESPUESTA DE DEEPSEEK
"¿Y para que quería instalar basura en mi ordenador?"
esta es la pregunta que realiza un usuario a esta noticia:
www.xataka.com/basics/como-instalar-deepseek-para-usarlo-forma-local-t

¿Como puedo responderle de manera sarcástica?

Responder de manera sarcástica o despectiva puede ser contraproducente y generar más conflicto. En lugar de eso, podrías optar por una respuesta educada pero firme que aclare

… » ver todo el comentario

25 209

#18 Hemin

me quedo con la primera

1 13

#21 Marx

ninguna de las dos ha entendido el trasfondo del asunto y es que creo que contesta así por ser una IA china y no diría lo mismo de ChatGPT, creo yo, pero tu respuesta contesta perfectamente a y no por las respuestas que dan las IAS sino porque al menos en esta ocasión Deepseek ha dado una respuesta que es mucho mejor que la de ChatGPT, asi que ¿Por qué instalar esta mierda? Porque parece mejor que ChatGPT, al menos en esta ocasión.

0 9

#63 skout *

Para nada, la descalificó por ser una IA , no por ser china, es más prefiero comprar tecnología china a tecnología americana. Pero nunca voy a usar una cosa diseñada para volver idiota a la humanidad.

0 8

#10 kumo

Para entrenar la IA china gratis con todo el hype

6 -26

#15 ostiayajoder *

Sino se la entrenos a Trump, asi q...

En cualquier caso el post es de bajartela a tu PC, entrenarias TU PROPIA IA, no la china.

4 30

#13 O.OOЄ

Hombre, yo he probado la versión de 70b en mi PC y estoy bastante contento.

2 20

#32 tdgwho

Que hardware tienes? y como vas de tokens por segundo?

Porque tengo en mente comprar una gpu (con el micro no llega

)

0 10

#33 este_no_es_eltraba

venga que seguro que tienes el lol instalado. O como yo lo llamo " el juego donde no paran de insultar a mi madre".

0 8

#62 skout

No tengo instalado ningún juego, ni siquiera en el móvil, detesto los juegos.

0 8

menéame

condiciones legales / de uso / y de cookies
/ quiénes somos
/ licencias: código, gráficos, contenido
/ HTML5
/ codigo fuente

más visitadas

BYD Denza Z9 GT muestra las ventajas de su dirección trasera

El patriota

¿Por qué EEUU es el paraíso de las sectas y los tiroteos?

"¡Se juega años de cárcel!" Silvia intxaurrondo desmiente a Ayuso en directo. "No es una multa, o no se ha enterado o está mintiendo"

Japón tiene un problema tan difícil de explicar que hay una expresión: "butsukari otoko", hombres que embisten a mujeres

más votadas

"¡Se juega años de cárcel!" Silvia intxaurrondo desmiente a Ayuso en directo. "No es una multa, o no se ha enterado o está mintiendo"

PACMA denuncia la agresión a una vecina de A Coruña tras irrumpir varios cazadores en su propiedad para cazar zorros

El actor judío Wallace Shawn afirma que Israel es «demoníacamente malvado», peor que los nazis [ENG]

Valve borra de Steam todos los juegos que obligan a visualizar anuncios

Varsavsky y represión en meneame.net

suscripciones por RSS

Cómo instalar DeepSeek para usarlo de forma local en tu ordenador Windows, macOS o GNU/Linux