RAG Agent
RAG Agent
El RAG Agent es un componente de orquestación avanzado diseñado específicamente para tareas de búsqueda y respuesta basadas en conocimiento externo. Combina la potencia de un modelo de lenguaje con el acceso directo a bases de datos de documentos para responder preguntas de manera inteligente y verificable.
A diferencia de los flujos estándar, este agente implementa un ciclo de razonamiento que incluye la recuperación de fragmentos, la generación de la respuesta y una fase opcional de control de calidad para asegurar que la salida sea coherente y libre de alucinaciones.
Casos de Uso Principales
Utilice el RAG Agent para desarrollar soluciones que requieran:
- Consultas sobre Bases de Conocimiento: Para responder preguntas basadas en documentos específicos como manuales o políticas internas.
- Sistemas de Alta Precisión: En entornos donde se debe evitar información inventada mediante chequeos de alucinaciones.
- Búsqueda Híbrida: Cuando se necesita combinar documentos privados con búsqueda web en caso de no encontrar la información localmente.
- Automatización de Procesos: Para generar respuestas estructuradas (JSON) que alimenten otros sistemas automáticos.
Configuración Fundamental
Estos parámetros constituyen la base del comportamiento y la identidad del RAG Agent.
| Parámetro | Descripción Técnica | Propósito en el Flujo |
|---|---|---|
User Request | La consulta o pregunta directa del usuario que desencadena la ejecución. | Define el objetivo de búsqueda y procesamiento del agente. |
User Prompt | Plantilla personalizada (ej. {input}) para formatear la entrada del usuario. | Guía cómo el agente debe interpretar y procesar la solicitud inicial. |
Model | Conexión al Modelo de Lenguaje (LLM) que actuará como motor de razonamiento. | Encargado de procesar la pregunta junto con los documentos recuperados. |
Retrievers | Lista de mecanismos de búsqueda para encontrar documentos relevantes. | Actúan como la fuente de verdad externa de donde se extrae la información. |
Tools | Herramientas adicionales que el agente puede invocar durante la ejecución. | Amplía las capacidades del agente permitiéndole interactuar con otros servicios. |
Use Memory | Activa el sistema de memoria para mantener el contexto entre interacciones. | Permite diálogos coherentes donde el agente recuerda preguntas previas. |
Funcionalidades Avanzadas (Plug in advanced features)
Al configurar las opciones avanzadas, se habilitan capas de control y fiabilidad sobre el proceso de generación.
Quality Control: Verificación de Respuestas
Enable Document Relevance Grading: Activa la puntuación y filtrado de relevancia de cada documento recuperado antes de generar la respuesta.Enable Hallucination Check: Comprueba que la respuesta no contenga información inventada que no esté respaldada por los documentos fuente.Enable Answer Quality Check: Habilita una verificación para asegurar que la respuesta final aborda correctamente la pregunta original del usuario.
Resiliencia y Salida
Enable Web Search Fallback: Si no se encuentran documentos relevantes en los retrievers, permite que el agente busque en la web como último recurso.JSON Structured Output: Fuerza al agente a formatear la respuesta final como un objeto JSON válido.Stream: Envía la respuesta en tiempo real (streaming) a medida que se genera.Vector DB Metadata Schema: Esquema de metadatos que permite optimizar y acelerar la búsqueda en la base de datos vectorial.
Salidas del Componente
Response: El mensaje final que contiene la respuesta generada y validada por el agente.Agent: Un objetoCompiledGraphque representa al agente listo para ser ejecutado.Tool: Un objeto que permite que este agente sea utilizado como una herramienta por otros componentes.
Consejos y Mejores Prácticas
- Optimice los metadatos: Un buen esquema en
Vector DB Metadata Schemamejora drásticamente la relevancia de la búsqueda. - Priorice la seguridad: Habilitar
Answer Quality CheckyHallucination Checkreduce errores y mejora la confianza del usuario. - Gestión de recursos: Si el flujo es corto, desactive
Use Memorypara ahorrar recursos.
Puedes ver un video que muestra la potencia del Rag Agent aquí.