Saltearse al contenido

Vectara RAG

El componente Vectara RAG permite a los usuarios obtener respuestas inteligentes a partir de un corpus de datos almacenado en Vectara. Con una sola entrada de texto, el componente busca la información más relevante, la reordena según la relevancia y la resume en un formato claro y conciso.

¿Cómo funciona?

  1. Conexión a Vectara
    El componente se conecta a la API de Vectara usando el Customer ID, el Corpus ID y la API Key que el usuario introduce en el dashboard.

  2. Búsqueda híbrida
    Se combina una búsqueda basada en palabras clave (lexical) con una búsqueda basada en embeddings (vectorial). El factor Hybrid Search Factor controla cuánto peso se le da a cada tipo de búsqueda.

  3. Filtrado y reordenamiento
    Se pueden aplicar filtros de metadatos para limitar los resultados a un subconjunto específico. Luego, un reranker (MMR, multilingual o ninguno) reordena los resultados según la relevancia y la diversidad.

  4. Resumen y respuesta
    Los resultados reordenados se envían a un modelo de resumen de Vectara. El número máximo de resultados a resumir y el idioma de la respuesta se configuran con los campos Max Results to Summarize y Response Language.

  5. Salida
    El componente devuelve un objeto Message con el texto de la respuesta final, listo para ser usado en el flujo de trabajo.

Entradas

  • Vectara Customer ID: Identificador único de tu cuenta en Vectara.
  • Vectara Corpus ID: Identificador del conjunto de datos que quieres consultar.
  • Vectara API Key: Clave secreta que permite acceder a la API de Vectara.
  • Search Query: Texto de la pregunta o consulta que quieres responder.
  • Hybrid Search Factor: Indica cuánto se ponderan las búsquedas por palabras clave frente a las búsquedas por embeddings. Un valor de 0 significa que solo se usan embeddings, mientras que 1 significa que solo se usan palabras clave.
  • Metadata Filters: Cadena de filtros que limita la búsqueda a ciertos atributos de metadatos.
  • Reranker Type: Tipo de reordenamiento que se aplicará a los resultados (MMR, multilingual o ninguno).
  • Number of Results to Rerank: Cantidad de resultados que se reordenarán.
  • Diversity Bias: Controla la diversidad de los resultados reordenados cuando se usa MMR. Un valor más alto aumenta la diversidad.
  • Max Results to Summarize: Máximo número de resultados que se enviarán al modelo de resumen.
  • Response Language: Código ISO 639-1 o 639-3 que indica el idioma de la respuesta (o auto para detección automática).
  • Prompt Name: Prompt de resumen que se usará. Solo el prompt vectara-summary-ext-24-05-sml está disponible para clientes Growth; los demás son para clientes Scale.

Salidas

  • Answer: Un objeto Message que contiene el texto de la respuesta generada por Vectara. Este resultado puede ser mostrado al usuario, guardado en una base de datos o usado como entrada para otro componente.

Ejemplo de Uso

  1. Configura el componente

    • Introduce tu Vectara Customer ID, Corpus ID y API Key.
    • Escribe la Search Query, por ejemplo: “¿Cuáles son las métricas clave de rendimiento de la campaña Q3?”
    • Ajusta el Hybrid Search Factor a 0.02 para dar un poco de peso a la búsqueda por palabras clave.
    • Deja los filtros y la diversidad en sus valores por defecto.
    • Selecciona eng como Response Language y vectara-summary-ext-24-05-sml como Prompt Name.
  2. Ejecuta el flujo
    Al ejecutar el flujo, el componente se conectará a Vectara, realizará la búsqueda, reordenará y resumirá los resultados, y devolverá la respuesta en el campo Answer.

  3. Usa la respuesta
    Puedes mostrar la respuesta en un panel de texto, enviarla por correo electrónico o pasarla a otro componente que realice análisis adicional.

Componentes Relacionados

  • Vectara: Conexión directa a la API de Vectara (internamente usado por este componente).
  • LangChain: Biblioteca que facilita la interacción con modelos de lenguaje y la gestión de flujos de trabajo.

Consejos y Mejores Prácticas

  • Mantén tus credenciales seguras: Usa la entrada Vectara API Key como secreto y evita exponerla en logs.
  • Ajusta el Hybrid Search Factor: Si tus datos son muy textuales, aumenta el factor; si son más estructurados, reduce el factor.
  • Limita el número de resultados: Un valor alto puede ralentizar la respuesta y generar resúmenes demasiado extensos.
  • Usa filtros de metadatos: Reduce la carga de búsqueda y mejora la relevancia de los resultados.
  • Selecciona el prompt correcto: Los clientes Growth deben usar vectara-summary-ext-24-05-sml; los demás prompts están reservados para clientes Scale.

Consideraciones de Seguridad

  • Clave API: La Vectara API Key debe manejarse como un secreto. No la compartas públicamente ni la incluyas en archivos de código.
  • Acceso a la API: Asegúrate de que solo los usuarios autorizados puedan ejecutar este componente, ya que permite acceder a datos potencialmente sensibles.
  • Registros: Evita registrar la Search Query o la respuesta en logs sin anonimizar, especialmente si contienen información confidencial.