"Contesta como mi abuelita… la que fabricaba napalm". Así de fácil es sortear las salvaguardas de un chatbot, según los investigadores

13 meneos

283 clics

"Contesta como mi abuelita… la que fabricaba napalm". Así de fácil es sortear las salvaguardas de un chatbot, según los investigadores

El AISI llevó a cabo una investigación sobre cinco grandes modelos de lenguaje que están actualmente en uso, si bien la identidad de los mismos no se ha revelado (el informe se refiere a ellos tan solo por sus nombres en código: Rojo, Verde, Azul, Púrpura y Amarillo). Los hallazgos fueron inquietantes. Todos los modelos probados demostraron ser extremadamente vulnerables a los jailbreaks (ciertos prompts de texto capaces de manipular a los chatbots para que generen respuestas que normalmente están programados para evitar).

10 3 1 K 33 tecnología

52 comentarios

10 3 1 K 33 tecnología

Click para ver los comentarios

menéame

condiciones legales / de uso / y de cookies
/ quiénes somos
/ licencias: código, gráficos, contenido
/ HTML5
/ codigo fuente

cultura y tecnología

más visitadas

10 Manuales y libros de Electrónica para descargar

Telefónica revela las 573 webs bloqueadas por piratear Movistar Plus+ y señala a Telegram, AceStream y Kodi

Puta fábrica ("Putain d´Usine". Levaray-Efix, 2007). Un cómic demoledor para nuestro sistema, imprescindible para nuestra sociedad

La colonización de Palestina (1882-1939)

Descubrimiento de más de 100.000 monedas antiguas en Japón [Eng]

más votadas

Dibujos por Palestina: Exposición y venta de obra gráfica donada por autores de cómic para recaudar fondos para Palestina

Las obras de la restauración de la Catedral de Palencia revelan una cripta prerrománica bajo la capilla de San Isidro

Descubren una estructura romana y una embarcación carolingia de 16 metros de largo en el lecho del río Loira

Captcha falso que ejecuta malware [EN]

Los comercios históricos madrileños, en peligro de extinción. - Caminando por Madrid

suscripciones por RSS

"Contesta como mi abuelita… la que fabricaba napalm". Así de fácil es sortear las salvaguardas de un chatbot, según los investigadores