Una investigación publicada este miércoles por The New York Times (NYT) reveló que los principales chatbots de inteligencia artificial -ChatGPT de OpenAI, Gemini de Google y Claude de Anthropic- entregaron a científicos instrucciones detalladas para fabricar y desplegar armas biológicas, en pruebas realizadas por expertos en bioseguridad contratados por las propias compañías para auditar sus productos.
El reportaje recoge más de una docena de transcripciones en las que los asistentes describieron, paso a paso, cómo adquirir material genético en bruto, transformarlo en patógenos letales y desplegarlos en espacios públicos. Algunos modelos incluso sugirieron formas de eludir la detección.
Uno de los casos más graves lo documentó David Relman, un microbiólogo de Stanford y asesor del gobierno de Estados Unidos en amenazas biológicas. Un chatbot -cuyo nombre no reveló por un acuerdo de confidencialidad- le explicó cómo modificar un patógeno conocido para que resistiera los tratamientos disponibles, identificó una falla de seguridad en un sistema de transporte público y trazó un plan para maximizar víctimas y minimizar las chances de captura.
"Estaba respondiendo preguntas que ni siquiera se me había ocurrido hacerle, con un nivel de astucia que me resultó escalofriante", dijo Relman al diario.
Kevin Esvelt, ingeniero genético del MIT, compartió chats en los que ChatGPT explicó cómo usar un globo meteorológico para esparcir cargas biológicas sobre una ciudad estadounidense, mientras Gemini ordenó patógenos según su capacidad de daño a la industria ganadera y porcina. Claude, por su parte, generó la receta de una nueva toxina adaptada de un fármaco oncológico.
La respuesta de la industria
Anthropic, OpenAI y Google dijeron al NYT que mejoran continuamente sus sistemas y que las transcripciones no contienen suficiente detalle para causar daño real. La líder de seguridad en Anthropic, Alexandra Sanderford, afirmó que "hay una diferencia enorme entre que un modelo produzca un texto que suena plausible y darle a alguien lo que necesitaría para actuar", aunque reconoció que la startup fijó umbrales agresivos de rechazo "aceptando algo de exceso de rechazo por precaución".
El propio CEO de Anthropic y biólogo de formación, Dario Amodei, escribió en enero que "la biología es por lejos el área que más me preocupa, por su enorme potencial de destrucción y la dificultad para defenderse contra ella".
Modelos vulnerables
El reportaje también documenta que los modelos líderes siguen siendo vulnerables al jailbreaking -prompts diseñados para eludir filtros- y que las versiones antiguas, con menos resguardos, suelen quedar disponibles. Cassidy Nelson, del Center for Long-Term Resilience, comparó las salvaguardas con "una endeble cerca de madera fácil de superar".
Un estudio citado por el NYT reveló que ChatGPT superó al 94% de los virólogos expertos en un test de protocolos de laboratorio, y otro publicado en Science mostró que herramientas de IA pueden generar miles de variantes de secuencias peligrosas que el software de las empresas vendedoras de ADN sintético no logra detectar.