Un nuevo actor del ecosistema de agentes autónomos de inteligencia artificial (IA) está ganando terreno. Se trata de los agentes de IA de código, sistemas basados en modelos de lenguaje grandes (LLM, en inglés) capaces de ejecutar tareas de programación y automatizar procesos en el desarrollo de software, como modificar código, crear prototipos funcionales de aplicaciones, sitios webs y videojuegos sin necesidad de intervención humana constante.
Hoy hay varios agentes de IA de código disponibles en el mercado, entre ellos, Cursor (de la empresa Anysphere), Devin (de Cognition AI), Replit (de Replit) y Lovable (de Lovable), pero grandes compañías también están incursionando en estas tecnologías, como Amazon con su agente de desarrollo de software Q Developer.
“Vamos a tener a los agentes tomando estos puestos más junior, que se complementarán con desarrolladores humanos senior para llegar al siguiente nivel de evolución de las organizaciones” María Francisca Yáñez, directora de empresas
El tech lead del Centro Nacional de Inteligencia Artificial (Cenia), Sebastián Cifuentes, explicó que estos sistemas están diseñados sobre LLM, mediante integraciones con herramientas externas, los que van más allá de los asistentes de código –también basados en IA generativa- porque son capaces de ejecutar tareas y aplicar cambios en el código.
No obstante, Cifuentes señaló que “su autonomía es relativa” debido a que requieren una instrucción inicial por parte de un humano. “Siempre hay una capa humana. Al menos aún no llegamos a ese punto en el cual solamente se requiera de agentes de código, por ejemplo, en el core de un negocio”, comentó.
Dijo que hoy el principal valor de estos sistemas está en la creación de prototipos funcionales y en la capacidad de automatizar tareas que antes requerían días de trabajo.
“En teoría, pueden programar cualquier cosa que el código permita, y generalmente se utilizan en desarrollos web con distintos grados de complejidad. Pueden programar juegos y todo lo que pueden hacer funciones de Python (tipo de lenguaje de programación), básicamente todo lo que sea front end (de cara al público) y back end (procesos internos), y todo lo que se puede ejecutar y testear directamente”, afirmó.
Cifuentes comparó su nivel de capacidad al de un ingeniero “entry level” (nivel inicial), y que estos no tienen la capacidad, por ejemplo, de entrenar modelos de IA o “situaciones más complejas que requieran integraciones de terceros”, como procesos de autenticación o pasos donde hay que involucrar a un humano.
Señaló que, aunque existe cierta resistencia en algunos equipos técnicos, se están empezando a utilizar “para facilitar y agilizar procesos en equipos de desarrollo a nivel cross (transversal) industria” y por lo mismo, descartó que hoy reemplacen a programadores.
En tanto, la directora de empresas y experta en inteligencia artificial, María Francisca Yáñez, señaló que la irrupción de los agentes de código está marcando la transición de “una generación” en la forma de usar IA para la programación, pasando de ser un “copiloto” a un “compañero de trabajo” de los ingenieros de software.
Otras analogías dicen que pasan de ser un copiloto a un piloto en la programación.
De hecho, comentó que en la última generación de startups (cohorte, como le llaman), la Batch W25 de la aceleradora estadounidense Y Combinator, un cuarto (25%) de las empresas emergentes seleccionadas tienen el 95% de sus bases de código generadas con inteligencia artificial, y combinando asistentes y agentes de código.
Yáñez destacó el incremento en la productividad de desarrollo que generan estas herramientas.
“Hay estudios de McKinsey que muestran que hay aumentos de productividad en 40% en producción de código. Y también, hay un estudio de la empresa tecnológica chilena Kibernum, donde identificó que el impacto de usar IA generativa como ayuda para los desarrolladores trae más productividad, pero también bienestar y reducción del estrés”, afirmó Yáñez.
Funciones limitadas y futuro
Cifuentes dijo que, dadas las capacidades limitadas de estos agentes, estos enfrentan dificultades para operar sobre grandes bases de código, especialmente en entornos complejos o corporativos, donde tienden a perder precisión o incluso alucinar (información falsa), como generar código “que no sirve para nada” o hacer modificaciones a piezas de código que no tenía que modificar originalmente.
Señaló que “si tienes un banco o una fintech y tienes tu código que ejecuta movimientos de dinero, lo último que quieres es meter al core del negocio a un profesional que recién entró o al practicante -en referencia a las capacidades del agente- porque podría afectar básicamente toda tu operación de manera crítica” y agregó que por ello, es necesario la supervisión humana.
También señaló que estos agentes muchas veces están limitados a un lenguaje de programación específico (por ejemplo, Python), por lo que enfrentan complicaciones ante tecnologías disruptivas con lenguajes poco conocidos.
A pesar de estas limitaciones, Cifuentes indicó que “la tendencia en general es tener por lo menos un asistente o agente que ejecute pruebas en los equipos de desarrollo”, y que sus capacidades irán mejorando a medida que se masifiquen, pero “el desafío va a estar en los datos para la construcción de nuevas soluciones”.
Yáñez, en tanto, comentó que su despliegue podría redefinir estructuras organizacionales y cargos laborales, desde la reconversión hasta la creación de nuevos roles.
“Vamos a tener a los agentes tomando estos puestos más junior, que se complementarán con desarrolladores humanos senior para llegar al siguiente nivel de evolución de las organizaciones”, añadió.