Modelo de lenguaje LLaMA ejecutado en una antigua computadora con Windows 98 y 128 MB de RAM [EN]

99 meneos

942 clics

Modelo de lenguaje LLaMA ejecutado en una antigua computadora con Windows 98 y 128 MB de RAM [EN]

Un grupo de investigadores de inteligencia artificial ha demostrado cómo ejecutar un potente modelo de lenguaje de IA en un ordenador con Windows 98. Y no estamos hablando de un PC cualquiera, sino de un sistema Pentium II clásico con apenas 128 MB de RAM. El equipo que está detrás del experimento es EXO Labs, una organización formada por investigadores e ingenieros de la Universidad de Oxford.

52 47 2 K 422 tecnología

33 comentarios

52 47 2 K 422 tecnología

Comentarios destacados:

#3 eduardor2k *

Ok, Han ejecutado una versión optimizada de llama de 260.000 parámetros, que seguramente cabe en esos 128mb de RAM, por lo que la noticia es un poco sensacionalista.

Tienes modelos de llama que ocupan 1gb de RAM, que puedes ejecutar en CPU y que son extremadamente rápidos, pero que al ser muy simples, sus respuestas suelen dejar bastante que desear.

Para los que quieran trastear un poco, solo tienes que bajarte "ollama" y probar modelos que quepan en tu RAM.

Llama3.2:3b suele equivaler a algo menos de 3gb de RAM
Los modelos 8b suelen ser menos de 8gb de RAM

Cuanto mayor xb más preciso es, más consumo de RAM y más lento es.

4 46

#4 prejudice

por lo que he leido lo importante es la RAM
Si se pudiera poner a un procesador equivalente a un 486 varios teras de RAM podría moverlo (Aunque supongo que aumentaría la latencia bastante)

2 26

#7 navi2000

en realidad lo importante es la VRAM. Evidentemente se puede sustituir VRAM por RAM como han hecho en este caso, pero incluso se podría sustituir la VRAM por memoria paginada en disco duro, pero entonces la velocidad decaería muchísimo. La cuestión es que para que un modelo sea útil, no solo debe dar buenas respuestas, las debe dar en un tiempo aceptable. Unos 3 tokens por segundo puede ser el límite de lo aceptable, pero sin duda 1 token por minuto sería absolutamente inútil.

2 23

#18 c0re

aún tengo alguna PCI y AGP de 256Mb, como me gustan estos “rescates” de tecnología obsoleta.

1 20

#27 repl_logos

Linux puede usar VRAM como RAM.

Por cierto, he ejecutado whisper_cpp en un netbook ATOM n270, 1GB de RAM, haciendo como 1.5 con ZRAM.

Para transcribir un vídeo de 5 minutos tardó como entre 6 y 8 horas.

1 17

#10 mahuer

La máxima capacidad de direccionamiento de memoria de un sistema de 32 bits, 2^32= 2GB

0 10

#11 mahuer

quería decir 4 G bits, he mezclado cosas.

0 10

#17 diablos_maiq

2GiB de memoria positiva y otros 2 de memoria negativa

0 10

#21 mahuer

2 Gb para unos y 2 Gb para ceros.

0 10

#15 mstk

64GB si el procesador dispone de PAE

0 7

#12 llorencs *

RAM y RAM en la GPU, es decir VRAM. La VRAM es la más importante.

0 10

#25 Westgard

si me encuentras un 486 que sea de 64 bits (para el direccionamiento de la RAM) lo hablamos

0 10

#30 diablos_maiq

640 kB deberían ser suficientes para todo el mundo

0 10

#31 prejudice *

por eso hablo de un equivalente no de un 486

0 7

#5 tpm1

Lo importante de la noticia es esto:

"For this, the company is developing what it calls the "BitNet" – a transformer architecture that uses ternary weights to drastically reduce model size. With this architecture, a 7 billion parameter model needs just 1.38GB of storage, making it feasible to run on most budget hardware."

6 56

#6 parladoiro

será por modelos de todos los tamaños para edge y ARM.

0 10

#8 vazana

¿pero va con CUDA o va lento?

0 10

#14 Sr.Polilla

Pocos CUDAs vas a mover en un Pentium 2, por lo que veo, para AGP lo último que salió fue la serie 7000 GTX.

0 7

#16 vazana *

H100 como derecho fundamental para todos.

Acabemos con la pobreza de GPUs.

0 10

#19 sysdani

Con la cuantización máxima en FP32 son 4 bytes por parámetro, 260.000 * 4 = 1040000 bytes = 0,9918212890625 MB, es un modelo que no llega a 1 mega de RAM.

0 6

#33 StarlightHunter.com

Pues en breve si te descuidas te pasa lo mismo. Los juegos ya van por el orden de 150GB de disco.

1 19

#9 Ainur *

Lo importante es que IA para tareas sencillas es viable en dispositivos pequeños con pocos recursos, como por ejemplo un horno que se configura con la voz sin necesidad de conexion a internet. Por poner un ejemplo

1 14

#13 parladoiro *

un horno usará SeamlessAlign(por poner la de Meta, hay otras) para convertir voz en una instrucción propia. Llama obviando el chiste del nombre en un horno es tonteria primero por meterte en la consola de texto, ya que por voz sería usar la SeamlessAling y segundo la función sería para recetas.

0 10

#20 sysdani

Aunque lo veremos es una mala idea que cada dispositivo tenga su propia IA separado del resto del ecosistema. Lo óptimo es que los diferentes dispositivos se conecten a la red interna y sea la misma IA de casa, oficina o donde sea la que administre los dispositivos. En caso contrario tendrás que hacer correcciones y actualizaciones en todas y cada una de ellas de forma periódica, sin entrar en el consumo de recursos innecesario.

1 16

#22 tdgwho

Como JARVIS

0 10

#1 Peka

Tengo un 386sx con 4 megas y disco duro de 40 megas. A ver qué hacen.

0 13

#2 skaworld

Es capaz de entender lenguaje natural, pero responde siempre empezando con un "Eso me recuerda a lo que dijo el otro dia Iker Jimenez"

5 58

#23 troll_hdlgp

Con eso también puedes ejecutarlo, pero a todos los prompts va a responder con "Hola mundo"

0 9

#32 PaleBlueAtom

no será IBM? Yo empecé en el mundo digital con ese... Para jugar a un juego tenía que borrar el anterior e instalar el nuevo. Qué tiempos!!

0 10

#28 ACEC

Por fin Clippo va a ser inteligente

0 10

#29 pacote

Menos mal que salen cosicas como esta para demostrar que no hace falta tener una gráfica nvidia de 1000 euros para "mover un poco" un modelo de IA ya entrenado.

0 9

#24 neiviMuubs

Al final estos modelos serán el nuevo Doom. ¿Puede el microondas de casa correr uno? al tiempo...

0 7

#26 SmithW6079

Y a 640x480 con dos webos

0 6

menéame

condiciones legales / de uso / y de cookies
/ quiénes somos
/ licencias: código, gráficos, contenido
/ HTML5
/ codigo fuente

más visitadas

DeepSeek y los tapones de plástico

La ONU activa por primera vez el Protocolo de Seguridad Planetaria por un asteroide peligroso: hay cinco posibles zonas de impacto

El ridículo de Franco en un vídeo de 1937

Un estadounidense llama a inmigración para que detenga a indocumentados en un supermercado

Chequia: El gobierno llevaba 7 años planeándola, los castores construyeron la presa en 2 días y les ahorró 1 millón de dólares [ENG]

más votadas

El Gobierno prohibirá este febrero las llamadas comerciales que se realizan con números de teléfono móvil

Tesla niega que el nombre de su nuevo Tesla Führer SS88 haga alusión alguna al nazismo y no entiende por qué se está vendiendo tan mal

Abogados Cristianos pierde la apelación y tendrá que pagar costas a los editores de 'El Niño Jesús no odia a los mariquitas'

Ayuso, acorralada en la Asamblea por su "matrimonio" con Ana Rosa: un "trato de favor" de 11 millones

Musk destituyó al jefe de la FAA de su cargo 10 días antes del accidente del avión y helicóptero en Washington

suscripciones por RSS

Modelo de lenguaje LLaMA ejecutado en una antigua computadora con Windows 98 y 128 MB de RAM [EN]