Saltearse al contenido

RAG Agent

RAG Agent

El RAG Agent es un componente de orquestación avanzado diseñado específicamente para tareas de búsqueda y respuesta basadas en conocimiento externo. Combina la potencia de un modelo de lenguaje con el acceso directo a bases de datos de documentos para responder preguntas de manera inteligente y verificable.

A diferencia de los flujos estándar, este agente implementa un ciclo de razonamiento que incluye la recuperación de fragmentos, la generación de la respuesta y una fase opcional de control de calidad para asegurar que la salida sea coherente y libre de alucinaciones.

Casos de Uso Principales

Utilice el RAG Agent para desarrollar soluciones que requieran:

  • Consultas sobre Bases de Conocimiento: Para responder preguntas basadas en documentos específicos como manuales o políticas internas.
  • Sistemas de Alta Precisión: En entornos donde se debe evitar información inventada mediante chequeos de alucinaciones.
  • Búsqueda Híbrida: Cuando se necesita combinar documentos privados con búsqueda web en caso de no encontrar la información localmente.
  • Automatización de Procesos: Para generar respuestas estructuradas (JSON) que alimenten otros sistemas automáticos.

Configuración Fundamental

Estos parámetros constituyen la base del comportamiento y la identidad del RAG Agent.

ParámetroDescripción TécnicaPropósito en el Flujo
User RequestLa consulta o pregunta directa del usuario que desencadena la ejecución.Define el objetivo de búsqueda y procesamiento del agente.
User PromptPlantilla personalizada (ej. {input}) para formatear la entrada del usuario.Guía cómo el agente debe interpretar y procesar la solicitud inicial.
ModelConexión al Modelo de Lenguaje (LLM) que actuará como motor de razonamiento.Encargado de procesar la pregunta junto con los documentos recuperados.
RetrieversLista de mecanismos de búsqueda para encontrar documentos relevantes.Actúan como la fuente de verdad externa de donde se extrae la información.
ToolsHerramientas adicionales que el agente puede invocar durante la ejecución.Amplía las capacidades del agente permitiéndole interactuar con otros servicios.
Use MemoryActiva el sistema de memoria para mantener el contexto entre interacciones.Permite diálogos coherentes donde el agente recuerda preguntas previas.

Funcionalidades Avanzadas (Plug in advanced features)

Al configurar las opciones avanzadas, se habilitan capas de control y fiabilidad sobre el proceso de generación.

Quality Control: Verificación de Respuestas

  • Enable Document Relevance Grading: Activa la puntuación y filtrado de relevancia de cada documento recuperado antes de generar la respuesta.
  • Enable Hallucination Check: Comprueba que la respuesta no contenga información inventada que no esté respaldada por los documentos fuente.
  • Enable Answer Quality Check: Habilita una verificación para asegurar que la respuesta final aborda correctamente la pregunta original del usuario.

Resiliencia y Salida

  • Enable Web Search Fallback: Si no se encuentran documentos relevantes en los retrievers, permite que el agente busque en la web como último recurso.
  • JSON Structured Output: Fuerza al agente a formatear la respuesta final como un objeto JSON válido.
  • Stream: Envía la respuesta en tiempo real (streaming) a medida que se genera.
  • Vector DB Metadata Schema: Esquema de metadatos que permite optimizar y acelerar la búsqueda en la base de datos vectorial.

Salidas del Componente

  • Response: El mensaje final que contiene la respuesta generada y validada por el agente.
  • Agent: Un objeto CompiledGraph que representa al agente listo para ser ejecutado.
  • Tool: Un objeto que permite que este agente sea utilizado como una herramienta por otros componentes.

Consejos y Mejores Prácticas

  • Optimice los metadatos: Un buen esquema en Vector DB Metadata Schema mejora drásticamente la relevancia de la búsqueda.
  • Priorice la seguridad: Habilitar Answer Quality Check y Hallucination Check reduce errores y mejora la confianza del usuario.
  • Gestión de recursos: Si el flujo es corto, desactive Use Memory para ahorrar recursos.

Puedes ver un video que muestra la potencia del Rag Agent aquí.