Vectara RAG
El componente Vectara RAG permite a los usuarios obtener respuestas inteligentes a partir de un corpus de datos almacenado en Vectara. Con una sola entrada de texto, el componente busca la información más relevante, la reordena según la relevancia y la resume en un formato claro y conciso.
¿Cómo funciona?
-
Conexión a Vectara
El componente se conecta a la API de Vectara usando el Customer ID, el Corpus ID y la API Key que el usuario introduce en el dashboard. -
Búsqueda híbrida
Se combina una búsqueda basada en palabras clave (lexical) con una búsqueda basada en embeddings (vectorial). El factor Hybrid Search Factor controla cuánto peso se le da a cada tipo de búsqueda. -
Filtrado y reordenamiento
Se pueden aplicar filtros de metadatos para limitar los resultados a un subconjunto específico. Luego, un reranker (MMR, multilingual o ninguno) reordena los resultados según la relevancia y la diversidad. -
Resumen y respuesta
Los resultados reordenados se envían a un modelo de resumen de Vectara. El número máximo de resultados a resumir y el idioma de la respuesta se configuran con los campos Max Results to Summarize y Response Language. -
Salida
El componente devuelve un objetoMessage
con el texto de la respuesta final, listo para ser usado en el flujo de trabajo.
Entradas
- Vectara Customer ID: Identificador único de tu cuenta en Vectara.
- Vectara Corpus ID: Identificador del conjunto de datos que quieres consultar.
- Vectara API Key: Clave secreta que permite acceder a la API de Vectara.
- Search Query: Texto de la pregunta o consulta que quieres responder.
- Hybrid Search Factor: Indica cuánto se ponderan las búsquedas por palabras clave frente a las búsquedas por embeddings. Un valor de 0 significa que solo se usan embeddings, mientras que 1 significa que solo se usan palabras clave.
- Metadata Filters: Cadena de filtros que limita la búsqueda a ciertos atributos de metadatos.
- Reranker Type: Tipo de reordenamiento que se aplicará a los resultados (MMR, multilingual o ninguno).
- Number of Results to Rerank: Cantidad de resultados que se reordenarán.
- Diversity Bias: Controla la diversidad de los resultados reordenados cuando se usa MMR. Un valor más alto aumenta la diversidad.
- Max Results to Summarize: Máximo número de resultados que se enviarán al modelo de resumen.
- Response Language: Código ISO 639-1 o 639-3 que indica el idioma de la respuesta (o
auto
para detección automática). - Prompt Name: Prompt de resumen que se usará. Solo el prompt
vectara-summary-ext-24-05-sml
está disponible para clientes Growth; los demás son para clientes Scale.
Salidas
- Answer: Un objeto
Message
que contiene el texto de la respuesta generada por Vectara. Este resultado puede ser mostrado al usuario, guardado en una base de datos o usado como entrada para otro componente.
Ejemplo de Uso
-
Configura el componente
- Introduce tu Vectara Customer ID, Corpus ID y API Key.
- Escribe la Search Query, por ejemplo: “¿Cuáles son las métricas clave de rendimiento de la campaña Q3?”
- Ajusta el Hybrid Search Factor a 0.02 para dar un poco de peso a la búsqueda por palabras clave.
- Deja los filtros y la diversidad en sus valores por defecto.
- Selecciona
eng
como Response Language yvectara-summary-ext-24-05-sml
como Prompt Name.
-
Ejecuta el flujo
Al ejecutar el flujo, el componente se conectará a Vectara, realizará la búsqueda, reordenará y resumirá los resultados, y devolverá la respuesta en el campo Answer. -
Usa la respuesta
Puedes mostrar la respuesta en un panel de texto, enviarla por correo electrónico o pasarla a otro componente que realice análisis adicional.
Componentes Relacionados
- Vectara: Conexión directa a la API de Vectara (internamente usado por este componente).
- LangChain: Biblioteca que facilita la interacción con modelos de lenguaje y la gestión de flujos de trabajo.
Consejos y Mejores Prácticas
- Mantén tus credenciales seguras: Usa la entrada Vectara API Key como secreto y evita exponerla en logs.
- Ajusta el Hybrid Search Factor: Si tus datos son muy textuales, aumenta el factor; si son más estructurados, reduce el factor.
- Limita el número de resultados: Un valor alto puede ralentizar la respuesta y generar resúmenes demasiado extensos.
- Usa filtros de metadatos: Reduce la carga de búsqueda y mejora la relevancia de los resultados.
- Selecciona el prompt correcto: Los clientes Growth deben usar
vectara-summary-ext-24-05-sml
; los demás prompts están reservados para clientes Scale.
Consideraciones de Seguridad
- Clave API: La Vectara API Key debe manejarse como un secreto. No la compartas públicamente ni la incluyas en archivos de código.
- Acceso a la API: Asegúrate de que solo los usuarios autorizados puedan ejecutar este componente, ya que permite acceder a datos potencialmente sensibles.
- Registros: Evita registrar la Search Query o la respuesta en logs sin anonimizar, especialmente si contienen información confidencial.