Los modelos de lenguaje pueden explicar las neuronas en los modelos de lenguaje. [EN]

14 meneos

102 clics

Los modelos de lenguaje pueden explicar las neuronas en los modelos de lenguaje. [EN]

Usamos GPT-4 para escribir automáticamente explicaciones sobre el comportamiento de las neuronas en modelos de idiomas grandes y para obtener esas explicaciones. Lanzamos un conjunto de datos de estas explicaciones y puntajes ( imperfectos ) para cada neurona en GPT-2.

11 3 1 K 14

6 comentarios

11 3 1 K 14

#1 --113769-- *

Algunos afirman que es un paso mágico, una especie de (previo a la) introspección. Un bucle en la inteligencia artificial. Una IA que explica como razona otra IA.

1 21

#3 QRK

"Una IA que explica como razona otra IA"

Según entiendo yo, más bien es que las personas que lo desarrollan han añadido una funcionalidad para que el usuario pueda conocer los circuitos por los que va pasando el modelo, a la hora de hacer una predicción.

Para así saber por qué se ha optado por una respuesta y no por otra.

Tampoco es nada del otro mundo.

0 6

#4 --113769--

han usado gpt4 para establecer textos que explican el disparo se neuronas concretas de gpt2. Y lo han extendido en un espacio grande de ejemplos. Son capaces de establecer una prediccion de textos qué explican esa activación.

Es como si pudiéramos analizar cuando se activa e interviene en una respuesta una neurona concreta de tu cerebro. Y lo hiciéramos en un montón de neuronas.

1 21

#6 QRK

En resumen es lo que yo digo. Sólo una funcionalidad extra. Que tampoco aporta nada más allá de saber el camino de la predicción dentro de la red neuronal.

0 6

#2 yurina

Pues claro. Puedes preguntarle a una red de éstas cualquier cosa. Siempre te responderá con algo. No significa mucho.

0 7

#5 --113769--

como? No entiendo tu comentario

1 21

comentarios cerrados

menéame

condiciones legales / de uso / y de cookies
/ quiénes somos
/ licencias: código, gráficos, contenido
/ HTML5
/ codigo fuente

Noticias de ciencia y lo que la rodea

más visitadas

Captadas por Venera 13 en 1982: Las únicas fotos que la humanidad tiene de la superficie de Venus (ENG)

Científicos afirman que la energía oscura no existe, y la expansión acelerada del Universo es una apariencia causada por la gravedad que ralentiza el tiempo

Un estudio demuestra que escribir a mano activa redes cerebrales más amplias que escribir a máquina [EnG]

Un gel de azúcar provoca un crecimiento vigoroso del cabello [ENG]

Se lanza en paracaídas con 100 millones de semillas para repoblar una región del Amazonas

más votadas

Captadas por Venera 13 en 1982: Las únicas fotos que la humanidad tiene de la superficie de Venus (ENG)

Científicos afirman que la energía oscura no existe, y la expansión acelerada del Universo es una apariencia causada por la gravedad que ralentiza el tiempo

Un estudio demuestra que escribir a mano activa redes cerebrales más amplias que escribir a máquina [EnG]

La revista Jara y Sedal azuza la caza del lobo ibérico y califica de "situación insostenible" que un lobo se coma una cierva en invierno

Un gel de azúcar provoca un crecimiento vigoroso del cabello [ENG]

suscripciones por RSS

Los modelos de lenguaje pueden explicar las neuronas en los modelos de lenguaje. [EN]