Saltearse al contenido

Ensemble Retriever

En el dashboard de Nappai, el Ensemble Retriever te permite unir la potencia de varios buscadores (retrievers) en un solo paso. Al enviar una consulta, el componente consulta cada buscador, combina sus respuestas y devuelve los documentos más relevantes. Es ideal cuando quieres aprovechar distintas fuentes de datos o algoritmos de búsqueda sin tener que ejecutar cada uno por separado.

¿Cómo funciona?

El componente recibe una lista de buscadores que ya están configurados en tu flujo. Cuando ejecutas una búsqueda, crea internamente un EnsembleRetriever de LangChain, asignándole un peso igual a cada buscador. Luego envía la consulta a este ensamblado y recupera los documentos más relevantes, limitados por el número de resultados que especifiques. Los documentos se convierten en un formato de datos estándar (Data) que puedes usar en cualquier otro componente de Nappai.

Entradas

Campos de Entrada

  • Retrievers: Los buscadores que quieres combinar. Debes conectar la salida de cada buscador que desees incluir.
  • Number of Results: Cantidad de documentos que quieres recibir de la búsqueda combinada. El valor por defecto es 20, pero puedes ajustarlo según tus necesidades.
  • Search Query: Texto de búsqueda que se enviará a todos los buscadores en el conjunto.

Salidas

  • Retriever: Devuelve el objeto EnsembleRetriever creado. Puedes usarlo en otros componentes que requieran un retriever.
  • Search Results: Lista de documentos (Data) que coinciden con la consulta. Cada elemento contiene el contenido, metadatos y la fuente original.

Ejemplo de Uso

  1. Añade el componente “Ensemble Retriever” al flujo.
  2. Conecta tres buscadores diferentes (por ejemplo, un buscador de texto, uno de embeddings y otro de búsqueda por metadatos) al campo Retrievers.
  3. Escribe la consulta en el campo Search Query (ej. “Resumen de ventas Q3”).
  4. Ajusta el número de resultados si quieres más o menos documentos.
  5. Ejecuta el flujo. Los resultados aparecerán en la salida Search Results, listos para mostrarse en un gráfico o tabla.

Componentes Relacionados

  • Retriever – El componente base que define la interfaz de búsqueda.
  • Document Search – Busca documentos en una única fuente; útil como uno de los componentes en el conjunto.
  • Vector Store Retriever – Recupera documentos basados en embeddings; excelente para combinar con búsquedas de texto.

Consejos y Mejores Prácticas

  • Equilibrio de pesos: Si un buscador es más confiable, puedes ajustar manualmente sus pesos en el código para darle mayor influencia.
  • Limita el número de resultados: Un número demasiado alto puede ralentizar la respuesta y sobrecargar la visualización.
  • Revisa los metadatos: Los resultados combinados incluyen metadatos de origen; utilízalos para filtrar o clasificar los documentos después de la búsqueda.

Consideraciones de Seguridad

  • Privacidad de datos: Asegúrate de que los buscadores conectados cumplan con las políticas de privacidad de tu organización.
  • Control de acceso: Si los buscadores acceden a datos sensibles, limita quién puede ejecutar el flujo que contiene el Ensemble Retriever.
  • Validación de entrada: Evita inyecciones de código o consultas maliciosas en el campo Search Query mediante filtros o sanitización previa.