3 meneos
44 clics
ImpNet: Puertas traseras imperceptibles e indetectables en redes neuronales compiladas (ENG)
Los primeros ataques de puertas traseras contra el aprendizaje automático desencadenaron una carrera armamentística en el desarrollo de ataques y defensas. Desde entonces han aparecido defensas que demuestran cierta capacidad para detectar puertas traseras en los modelos o incluso para eliminarlas. Estas defensas funcionan inspeccionando los datos de entrenamiento, el modelo o la integridad del procedimiento de entrenamiento. En este trabajo, demostramos que las puertas traseras pueden añadirse durante la compilación, eludiendo (...)
|
Click para ver los comentarios