Agentes: La nueva generación en IA generativa
Los comúnmente llamados agentes de IA, son sistemas basados en LLMs, capaces de realizar tareas de forma autónoma, sin necesidad de un flujo reactivo pregunta-respuesta. A diferencia de los asistentes/chatbots "normales", que se limitan a responder al usuario, los agentes pueden realizar multiples tareas antes de responder a un usuario, o usar "herramientas" dinámicamente, para realizar acciones en nombre del usuario.
¿Cómo Funcionan?
Esencialmente, un agente consiste de varios componentes que permiten que actue de forma dinámica y que amplia enormemente la utilidad de los LLMs
-
LLM: El elemento básico y más importante. Normalmente los agentes usan LLMs con soporte para tool_calls, que les permite llamar a procesos de código en base al contexto. Sin esta funcionalidad la usabilidad queda limitada, aunque si la tarea es sencilla y no requiere de interactuar con aplicaciones externas, podría llegar a implementarse.
-
System Prompt / Tarea: Es fundamental que el agente tenga un rol y tareas definidas. La mayoría de los LLMs soporta un System Prompt que nos permite darle instrucciones al modelo independientes del contexto. Entre otras cosas, podemos indicar normas de comportamiento y restricciones a las preguntas/órdenes del usuario, para dar seguridad al sistema.
-
Bucle de retroalimentación: Necesario para permitir que el modelo realice multiples generaciones antes de proporcionar una respuesta al usuario. Al usar herramientas, el modelo responde con los parámetros de entrada para el proceso, y se le debe responder con los resultados de ese proceso en un formato específico. Este bucle también permite iterar al LLM iterar una respuesta antes de contestar.
-
Otros Agentes: Una funcionalidad avanzada es combinar múltiples agentes especializados en tareas especificas, y que se puedan realizar preguntas entre si. Los agentes interacturian entre si como si fueran el usuario y el modelo, de forma que la funcionalidad queda segmentada y modularizada. No obstante, esto también implica desafios en la complejidad y capacidad de análisis del sistema completo, al depender del analisis del LLM para determinar a que agentes debe llamar.
Ejemplos de Agentes
- Codex: De OpenAI, y llamado en honor del primer modelo especializado en código creado por la compañia, contemporáneo de GPT-3. Permite al usuarios dar acceso a repositorios en GitHub, para que Codex los analice y realice tareas dadas con el código, como resolver pull requests.
- Discovery: De Microsoft, anunciado en el evento Microsoft Build 2025, es una plataforma con múltiples agentes especializados en análisis cientifico y analisis de documentación, orientado a asistir a investigadores a determinar la viabilidad de experimentos e investigaciones.
- Agent Mode de GitHub Copilot: Como parte de las funcionalidades de Copilot, el modo agente permite al LLM realizar varias tareas, como editar código, crear ficheros o consultar internet, con un unico prompt del usuario.
Conclusión
No cabe duda que los Agentes de IA son el futuro de la automatización en la mayoría de campos, al permitir a los cada vez más avanzados LLMs interactuar de forma autonoma y con un rol claro, más allá del chatbot, como parte de aplicaciones y sistemas computacionales.