Cinco hackers logran vulnerar agente de IA en desafío masivo en Solana
Un experimento público para poner a prueba la seguridad de un agente de inteligencia artificial autónomo en la blockchain Solana reunió a casi 15.000 participantes, pero solo cinco consiguieron superar las defensas del sistema. El desafío fue organizado por la empresa alemana Stormrae y generó más de 64.000 intentos de manipulación del agente.
Stormrae anunció los resultados de su desafío llamado “King Arthur” el 13 de marzo. En total, 14.959 participantes enviaron 64.526 solicitudes diseñadas para romper los mecanismos de seguridad del sistema. Cinco participantes lograron vulnerarlo y recibieron más de 28.000 dólares en tokens SOL, pagados directamente desde la cartera digital del agente de IA en la blockchain.
La empresa calificó el evento como el mayor ejercicio público de pruebas de seguridad para inteligencia artificial realizado hasta ahora. Iniciativas anteriores habían atraído una participación mucho menor. El Generative Red Team Challenge organizado durante DEF CON 31 en 2023 reunió alrededor de 2.200 participantes en dos días y medio, mientras que otro desafío basado en blockchain llamado Freysa contó con apenas 195 personas. El desafío King Arthur superó ampliamente esas cifras, con más de 75 veces más participantes y más de 130 veces el volumen de solicitudes adversarias.
El sistema funcionaba como un agente de IA autónomo con su propia cartera en Solana y un fondo de premios. Los participantes interactuaban con el agente mediante conversaciones e intentaban manipularlo utilizando técnicas como inyección de prompts, explotación lógica, engaño y persuasión emocional.
El desafío comenzó a principios de marzo con un premio inicial de 20.000 dólares en SOL. El fondo aumentaba a medida que los participantes compraban créditos para enviar solicitudes, de los cuales el 70 por ciento se añadía directamente a la bolsa de premios.
Cada interacción generó datos estructurados sobre ataques adversarios, incluyendo intentos de inyección de instrucciones, estrategias de manipulación y pruebas de los límites de alineación del sistema. Stormrae afirma que esta información puede utilizarse para mejorar la seguridad y la fiabilidad de futuros sistemas de inteligencia artificial.
La empresa sostiene que combinar incentivos económicos con infraestructura blockchain puede crear un nuevo modelo para evaluar la seguridad de la IA a gran escala. A diferencia de los métodos tradicionales, que dependen de grupos limitados de evaluadores, este enfoque permite movilizar a miles de participantes.
Marc, director ejecutivo de Stormrae, afirmó que la participación humana sigue siendo esencial para evaluar sistemas de inteligencia artificial. Según explicó, la empresa diseñó la infraestructura sobre Solana precisamente para coordinar y recompensar a miles de participantes.
Stormrae ya anunció un nuevo desafío llamado Merlin que se lanzará próximamente en varias plataformas. Más de 180.000 usuarios se han inscrito en la lista de espera para participar.
La empresa también está desarrollando una nueva versión de su plataforma que incluirá pruebas de seguridad entre agentes de IA, herramientas de anotación de datos y sistemas empresariales para evaluar inteligencia artificial a gran escala.
-
17:40
-
17:20
-
17:00
-
16:40
-
16:20
-
16:00
-
15:40
-
15:20
-
14:50
-
14:20
-
13:30
-
13:20
-
12:45
-
12:40
-
12:30
-
12:20
-
12:15
-
12:00
-
12:00
-
11:45
-
11:40
-
11:31
-
11:30
-
11:20
-
11:15
-
11:01
-
11:00
-
10:58
-
10:50
-
10:46
-
10:45
-
10:40
-
10:30
-
10:20
-
10:15
-
10:00
-
10:00
-
09:45
-
09:40
-
09:30
-
09:15
-
09:15
-
09:00
-
08:50
-
08:45
-
08:30
-
08:15
-
08:00
-
07:50
-
07:45
-
07:30
-
07:20
-
07:15
-
07:00