Saltearse al contenido

Capítulo 2: Construcción de la Base de Conocimiento (RAG)

En este capítulo, construiremos el “cerebro” de nuestro Agente de Nivel 1, que responderá preguntas generales. Este proceso convierte un documento en una base de datos que la IA puede consultar. Arquitectura completa del sistema de atención al cliente de tres niveles en NappAI.

Componentes Necesarios

  • Google Drive File Manager
  • Parse Data
  • Split Text
  • Google Generative AI Embeddings
  • Chroma DB

Construcción y Configuración Campo por Campo

Añade los siguientes componentes al lienzo y conéctalos como se indica:

  1. Google Drive File Manager

    • Propósito: Cargar el documento con las políticas de tu empresa.
    • Configuración:
      • Credential: Selecciona Mi Credencial de Drive.
      • Operation: Get.
      • Mode of Input: By Selection.
      • Select file: Elige el PDF o documento con tu información.
  2. Parse Data

    • Propósito: Extraer el texto del documento.
    • Conexión: Conecta la salida Data del Google Drive a la entrada data de este componente.
  3. Split Text

    • Propósito: Dividir el texto en fragmentos manejables.
    • Conexión: Conecta la salida processed_data del Parse Data a la entrada data.
    • Configuración:
      • Chunk Size: 1000.
      • Chunk Overlap: 200.
  4. Google Generative AI Embeddings

    • Propósito: Preparar el modelo para convertir texto en vectores.
    • Configuración:
      • Credential: Selecciona Mi Credencial de Gemini.
  5. Chroma DB

    • Propósito: Almacenar los fragmentos de texto como vectores.
    • Conexiones:
      • Conecta la salida chunks del Split Text a la entrada ingest_data.
      • Conecta la salida embeddings del Google Generative AI Embeddings a la entrada embedding.
    • Configuración:
      • Operation: Add.
      • Collection Name: ecommerce_policies (guarda este nombre, lo necesitarás).

Al ejecutar este flujo, habrás creado tu base de conocimiento.