Anthropic publicó inadvertidamente el código fuente de su popular agente de inteligencia artificial (IA), Claude, lo que generó dudas sobre su seguridad operativa y llevó a desarrolladores a buscar pistas sobre los planes de la startup.
“Hoy temprano, una versión de Claude Code incluyó parte de código fuente interno. No hubo datos sensibles de clientes ni credenciales involucradas o expuestas”, dijo un portavoz de Anthropic en una declaración enviada por correo electrónico. “Se trató de un problema en el empaquetado de la versión causado por error humano, no de una brecha de seguridad”.
Este es el segundo incidente de seguridad de la compañía en solo una semana. El error comprometió aproximadamente 1.900 archivos y 512.000 líneas de código relacionadas con Claude Code, una herramienta de programación basada en agentes que funciona directamente dentro de los entornos de desarrollo y tiene acceso a información sensible, según analistas de ciberseguridad. La filtración se conoció inicialmente a través de una publicación en X, que supuestamente compartía un enlace al código y acumuló más de 30 millones de visualizaciones.
Desarrolladores señalaron que estaban analizando los detalles para entender cómo funciona el agente y cómo la startup planea evolucionar la plataforma. Varios expertos también expresaron preocupación por posibles vulnerabilidades de seguridad a raíz de la exposición no intencionada.
“Los atacantes ahora pueden estudiar y hacer fuzzing (pruebas de entrada maliciosas) sobre cómo fluye la información a través del pipeline de gestión de contexto en cuatro etapas de Claude Code, y diseñar cargas maliciosas capaces de sobrevivir a la compresión, persistiendo efectivamente como una puerta trasera durante sesiones arbitrariamente largas”, indicó la firma de ciberseguridad en IA Straiker en una entrada de blog.
Hace unos días, Fortune informó que Anthropic también había hecho públicos accidentalmente miles de archivos, incluyendo un borrador de blog que detallaba un potente modelo en desarrollo conocido internamente como “Mythos” y “Capybara”, que presenta riesgos en materia de ciberseguridad.
“Estamos implementando medidas para evitar que esto vuelva a ocurrir”, señaló el portavoz de Anthropic.