Un nuevo algoritmo podría reducir los requerimientos energéticos de los sistemas de IA hasta en un 95 por ciento (eng)

267 meneos

882 clics

Un nuevo algoritmo podría reducir los requerimientos energéticos de los sistemas de IA hasta en un 95 por ciento (eng)

Los científicos de BitEnergy AI crearon un método llamado "Multiplicación de complejidad lineal" (L-Mul) que reemplaza las multiplicaciones complejas de punto flotante en los modelos de IA con sumas de números enteros más simples. El equipo probó su método en diversas tareas de lenguaje, visión y razonamiento, incluidas la comprensión del lenguaje, el razonamiento estructural, las matemáticas y la respuesta a preguntas de sentido común. dx.doi.org/10.48550/arxiv.2410.00907

118 149 3 K 411 tecnología

63 comentarios

118 149 3 K 411 tecnología

Comentarios destacados:

#1 sorrillo

O potencialmente que con el mismo consumo energético que el actual puedan multiplicar por 20 sus capacidades.

22 163

#2 Robus *

Efectivamente, yo lo veo como una posibilidad de Edge-AI que requiera un consumo muy pequeño de energia.

Ya tenemos el arduino BLE y el sparkfun con tensorflow que funciona con pilas de botón, si consigues multiplicar su capacidad en algo tan simple y barato se podrán hacer virguerías sin conexión al cloud y aumentando la protección de información.

7 73

#29 rojo_separatista

, habla de consumo en términos de energía, no en términos de memoria que es un limitante tanto o más importante para los Edge devices.

0 12

#37 Robus

para hacer inferencia no necesitas memoria.

0 11

#38 rojo_separatista *

, cómo que no? Para hacer inferencia tienes que cargar el modelo en memoria.

1 15

#54 Robus

mm.. a ver, para hacer inferencia tienes que cargar el modelo calculado, que ocupa muy poca memoria, solo son los valores de los pesos entre neuronas, por muchas neuronas que tengas y por muchas capas sigue siendo un tamaño pequeño...

100 neuronas x 100 neuronas x 50 neuronas x 25 neuronas = 100 x 100 pesos en la primera capa, en formato lite de tensorflow y restingiendo tamaño (quantization) ocupa menos de un byte cada peso, más 100 x 50 y otros 50 x 25 más la final (ejemplo simple)… » ver todo el comentario

0 11

#55 rojo_separatista

, cualquier modelo de lenguaje actual tiene miles de millones de parámetros que en términos de memoria son varios GB, cuantizar el modelo puede mejorar sustancialmente el espacio que ocupa en memoria el modelo pero ni de coña te soluciona la papeleta cuando hablamos de modelos grandes. Créeme el problema de la memoria que ocupan los modelos también es crítico y más cuando se habla de Edge devices.

0 12

#56 Robus

¿LLM? ¿que tiene eso que ver con Edge AI o con TinyML?

0 11

#57 rojo_separatista

, lo de LLM lo has dicho tu, yo he hablado de modelos de lenguaje que no tienen porque ser lo mismo, y con edge computing tiene que ver lo mismo que cualquier modelo de deep learning, ya sea un SLM o un modelo de visión que te interese correr en un dispositivo que esté diseñado para ello.

No me digas que no se necesita memoria para hacer inferencia en estos modelos porque llevo varios años peleándome en correr modelos de todo tipo en arquitecturas TFLite y TensorRT. Se ve que no has intentado nunca ejecutar nada en un Coral TPU con 8MB de SRAM conectado a una Raspberry, si no, te aseguro que no dirías que la memoria no se necesita para hacer inferencia.

0 12

#58 Robus

Bueno, digamos que tengo el USB Coral de Google desde que salió (hace más de 5 años) al igual que el Jestson nano... igual si que he hecho cosas con Edge IA y el problema no ha sido la memoria.

Digamos que tenemos experiencias distintas.

1 23

#3 Raziel_2 *

Si hasta ahora en todos los campos donde se ha conseguido ahorrar energía o sustituir la fuente por renovables solo ha servido para aumentar su consumo, en esto no va a ser diferente.

7 57

#6 capitan__nemo *

paradoja de Jevons

8 68

#39 d5tas

venía a eso. Si consiguen esa eficacia apuesto que el consumo energético de las IAs aumenta un 50% como mínimo.

0 6

#7 kaotan

El número 20 es justo el que recuerdo. Al sustituir las sumas actuales por una función más compleja, aunque fácil de calcular, es necesario 20 veces más entrenamiento de la red neuronal para alcanzar los mismos resultados actuales.

0 10

#11 caramelosanto *

o sea que lo que ahorras por un lado se gasta por otro? O entendi cualquier cosa?

0 6

#14 borre

Cómo las luces led. Lo que ahorras en gasto... lo gastas en más energía

0 11

#19 BM75

Explica eso...

0 7

#26 Dramaba

Suele pasar que, como te ahorras pasta con las leds, pones muchas más. Al final, tienes el mismo gasto pero con mucha más contaminación lumínica...

1 8

#28 BM75 *

No me parece para nada que eso pase.

PS: soy arquitecto y los proyectos de iluminación están muy optimizados.
En urbanización, hay normativas muy estrictas en cuanto a contaminación lumínica.

0 7

#30 Dramaba

Es más una sensación personal que otra cosa. Y noticias como la del alcalde de VIgo solo hacen que persista esa sensación.

0 10

#32 BM75

Es un caso muy muy muy anecdótico...

0 7

#42 sorrillo

A nivel de iluminación creo que tienes razón por que era un sector ya muy desarrollado, la luz que se ponía no estaba limitada tanto por su consumo como por su utilidad.

Aunque por ejemplo ahora los camiones llevan tanta iluminación que parecen árboles de navidad, aunque seguro que consumen menos en luz que antes ciertamente llevan más luz que nunca.

En sectores donde el coste energético ha limitado su desarrollo cuando ese coste energético se reduce es muy probable que se incremente su uso hasta volver a llegar al límite de coste energético anterior. Y la IA es un sector que está en esa fase, su consumo energético es ahora su limitante (están buscando comprar centrales nucleares).

1 20

#48 Miguel_Diaz_2

¿mismo gasto?. Ni de coña, vamos.
Antes con 5 bombillas de 100W incandescentes iluminabas más o menos 5 estancias. Con 500 watios en leds tu casa la luminosidad supera a la Navidad de Vigo.

0 6

#33 caramelosanto

doy fe, pasamos a led y ahora tengo mas luces philips hue que todas las bombillas que tenia antes de la revolución del led en mi vida juntas y prendidas al mismo tiempo.

0 6

#40 BM75

Pues muy mal. Allà tú con tu consumo innecesario...

0 7

#46 caramelosanto

son inteligentes, mas que eso no puedo hacer porque son demasiadas, se hace lo mejor que se puede. Pero iba a otro punto.

0 6

#18 memelada *

no, que a implique b no significa que b implique a.

es una simplificación muy burda

1 0

#27 LaInsistencia

Te lo voy a explicar de otra forma: "si antes podiamos pagar 15 millones de dolares al mes en electricidad, el mes que viene seguiremos pudiendo gastar los mismos 15 millones. Si antes dabamos de comer a 1.000 ordenadores con eso, ahora podremos dar de comer a 20.000. Voy empezando a pedir presupuesto para ampliar el datacenter...".

0 6

#53 memelada

sin embargo hay más variables que intervienen. no es tan sencillo.

0 6

#23 Jesucristo_cazavampiros *

por lo que yo entiendo, no. De hecho, con el hardware especializado actual este algoritmo ahorraria energia pero tanto el entrenamiento como la inferencia serian mas lentos (3 ciclos de reloj vs 1 por operacion). Por lo que a no ser que se fabrique hardware especializado para esta operacion no merecera la pena, y a las grandes empresas que poseen cientos de millones de dolares invertidos en hardware actual no les va a interesar.

0 6

#24 sxentinel

Económicamente creo que ahora mismo, les interesa gastar menos que aumentar las capacidades de la IA, las empresas del gremio están perdiendo pastas precisamente por eso a raudales...

Dudo mucho que ofrecer un aumento de su capacidad un 20% en el momento actual les reporte beneficios, ahora bien, bajar su consumo energético, les supone salvar sus cuentas, por lo que veo mas viable que lo dediquen a lo primero que a lo segundo.

0 10

#25 sorrillo *

les interesa gastar menos que aumentar las capacidades de la IA

Están en plena escalada de capacidades para ganarse un espacio en el mercado, están buscando como ampliar su consumo energético de forma barata planteándose comprar centrales nucleares.

En absoluto su prioridad es reducir costes, su prioridad es ganar la guerra comercial de la IA.

Dudo mucho que ofrecer un aumento de su capacidad un 20%

Yo he hablado de multiplicar por 20, que supone un aumento de "capacidad" del 1.900%, potencialmente que la IA sea un 1.900% más inteligente que ahora con el mismo consumo energético que el actual.

0 13

#43 sxentinel

No podemos saber lo que discurre por la cabeza de los directivos de las empresas de IA, para ser tan categóricos.

Pero si mi empresa pierde cientos de millones de euros al mes debido al consumo energético, hasta el punto de plantearme adquirir centrales nucleares para mitigarlo y al tiempo mantengo un equipo desarrollando las capacidades de la IA, yo al menos miraría ese ahorro con ojos golosos.

0 10

#44 sorrillo

Es una apuesta a futuro, no están perdiendo dinero lo están invirtiendo. Si considerasen que están perdiendo dinero apagarían los servidores y dejarían de insistir en la IA, por que es trivial cerrar el proyecto y dejar de consumir energía.

Lo que están haciendo es lo opuesto, están intentando comprar centrales nucleares para poder seguir usando la energía actual pero de forma más barata o incluso para poder consumir más por esa apuesta a futuro que están haciendo.

Si ahora les sale la oportunidad de ahorrar mucho dinero en energía o aumentar la velocidad de esa apuesta a futuro sin duda la mayoría elegirán lo segundo, ya que eso es lo consistente con lo que llevan haciendo hasta ahora.

0 13

#45 sxentinel

Sin quitarte la razón o dártela.

Me sigue raspando que se afirme tan categóricamente esa postura.

Pero para mi resulta una conversación que no lleva a nada. Los responsables eligieran lo que consideren oportuno en función de lo que crean que va a mejorar su posición en el mercado. Y seguramente, los distintos actores tomaran distintas posiciones, en función de sus intereses, que no todo es OpenAi.

0 10

#35 Menudajefa

sería impresionante!!!

0 6

#41 sieteymedio

Va a ser eso.

0 10

#15 pingON

Addition is All You Need for Energy-Efficient Language Models el paper completo ....

7 40

#51 carlosuyate

Gracias por ahorrarme la búsqueda.

0 6

#9 Grahml

Le darán una silla al esclavo que responde las preguntas del pringao que se cree que es el software el que le está respondiendo, y arreglado.

1 29

#13 caramelosanto *

al indio que maneja los autos en San Francisco. Esos que de vez en cuando los trollean a todos desde el call center cuando saturan un punto en particular.

0 6

#22 Torrezzno

Toda multiplicación es una serie de sumas y no por eso es más eficiente. Requiere muchos más ciclos de computación.

Por eso se usan algoritmos como el de Karatsuba

en.m.wikipedia.org/wiki/Karatsuba_algorithm

La suma de números flotantes tiene además problemas de pérdida de precisión y requiere otros algoritmos como el de Kahan

en.m.wikipedia.org/wiki/Kahan_summation_algorithm

A ver en qué queda el algoritmo. Potencialmente podría usarse para cualquier uso

2 23

#17 frg

Ahora otra noticia de la batería mágica semanal y otra que mencione grafeno y cantamos bingo, "fapbingo"

1 20

#21 kavra

una batería de grafeno diseñada por IA que si te la frotas te cura el cancer....

0 9

#34 mjmx

¿y los gatos? ¿Es que nadie piensa en los gatos?

1 18

#50 onainigo *

Como siempre te las das tú solo. Con tu incapacidad lectora
Con lo único que has demostrado ser bueno fue con el bot

0 20

#52 ccguy

tú todavía tienes que demostrar que eres bueno en algo

0 19

#60 sorrillo

No es eso lo que afirma el titular.

0 13

#61 Acuantavese

L-Mul could cut energy use for element-wise floating-point tensor multiplications by up to 95% and for dot products by 80%.

0 9

#62 sorrillo

Y el titular dice que eso implica una reducción de hasta el 95% en los requerimientos energéticos de los sistemas de AI.

Desconozco si es cierto, meramente indico que eso es lo que afirma el titular.

0 13

#63 Acuantavese

Sensacionalista a más no poder. Ya estaba buscando la empresa en bolsa para invertir

0 9

#31 LeDYoM

Han inventado la aritmético en punto fijo.
O la sopa de ajo.

0 10

#47 A1234

¿Y cuanta energía consume ese algoritmo?

0 9

#4 Acuantavese

95% ... ya, hagan sus apuestas señores

0 9

#5 sorrillo

94,8%

0 13

#12 caramelosanto

93,333333% que me gané?

0 6

#16 mecha

a ver quién se acerca más al ahorro exacto, pero sin pasarse. Quién acierte la cifra exacta gana una IA.
¡a jugar!

os habéis pasado.

0 7

#59 Acuantavese

Es el 95% en un tipo concreto de operaciones de coma flotante, ahora solo hay que ver lo que cuenta en el total, quizás un 1%

0 9

#8 OrialCon_Darkness

Esto sin duda, bajará los precios de toooooodas las páginas creadas para hacer deepfakes

0 8

#10 ccguy

Esto ya es viejo (en el mundo IA), "noticia" de hace 4 meses... ejemplo

arstechnica.com/information-technology/2024/06/researchers-upend-ai-st

1 2

#20 coderspirit *

No tiene absolutamente nada que ver lo uno con lo otro. Lo que tu enlazas está enfocado a reemplazar las multiplicaciones de matrices. Lo que ha llegado a portada hace unas horas sustituye las multiplicaciones de números individuales.

Como añadido, lo de MatMul-Free está muy restringido al caso concreto de los LLMs, mientras que lo que se está discutiendo aquí es muchísimo más genérico.

3 36

#36 onainigo

dx.doi.org/10.48550/arxiv.2410.00907
Subido al arxiv el 1 de octubre de 2024.

Nunca lees nada y lo que lees no lo entiendes.

Cc

4 30

#49 ccguy

me vas a dar tú lecciones sobre IA

0 19

comentarios cerrados

menéame

condiciones legales / de uso / y de cookies
/ quiénes somos
/ licencias: código, gráficos, contenido
/ HTML5
/ codigo fuente

cultura y tecnología

más visitadas

Amor de madre

Cantan frente a las Cortes Valencianas ‘Rata de dos patas’. “Rata inmunda. Animal rastrero”.

Todos tienen derecho a tener su propia opinión, pero nadie tiene derecho a tener sus propios hechos

Algunos consejos para mudarse de Twitter a Bluesky

'Spaced', serie mítica británica sobre el fenómeno eterno: jóvenes precarios

más votadas

Todos tienen derecho a tener su propia opinión, pero nadie tiene derecho a tener sus propios hechos

La IA de Elon Musk se vuelve contra él y le tacha de 'uno de los mayores difusores de desinformación en X' [EN]

China pone en marcha el mayor parque solar del mundo en mar abierto

'Spaced', serie mítica británica sobre el fenómeno eterno: jóvenes precarios

Samsung está culpando a la jornada laboral de 52 horas de sus trabajadores al fracaso del Exynos 2500, donde quiere libertad de horarios

suscripciones por RSS

Un nuevo algoritmo podría reducir los requerimientos energéticos de los sistemas de IA hasta en un 95 por ciento (eng)