Saltearse al contenido

Scorer Retriever

El Scorer Retriever es una herramienta sencilla que busca información dentro de un almacén de vectores (una base de datos que guarda documentos en forma de números) y solo devuelve los documentos que cumplen con un nivel mínimo de relevancia. Si un documento no alcanza el puntaje que tú establezcas, se descarta automáticamente.

¿Cómo funciona?

  1. Conexión al vector store
    El componente necesita que le indiques un Parent document vectorstore, es decir, la base de datos donde están guardados los documentos que quieres buscar.

  2. Definir la búsqueda
    Escribes una Search Query (consulta de búsqueda) con las palabras clave que te interesan. El componente envía esta consulta al vector store.

  3. Filtrar por puntaje
    Cada documento que el vector store devuelve tiene un score (puntaje) que indica cuán parecido es al texto de la consulta. El componente compara ese puntaje con el Score threshold que tú establezcas. Solo los documentos cuyo puntaje sea mayor o igual al umbral pasan al resultado final.

  4. Limitar la cantidad de resultados
    Con Number of Results puedes decidir cuántos documentos quieres ver. El componente devuelve hasta ese número de documentos que cumplan el criterio de puntaje.

El resultado es una lista de documentos relevantes, lista para que la uses en tu flujo de trabajo.

Entradas

Campos de Entrada

  • Parent document vectorstore: El almacén de vectores donde se encuentran los documentos que quieres consultar.
  • Number of Results: Número máximo de documentos que quieres que el componente devuelva.
  • Score threshold: Umbral mínimo de relevancia. Los documentos con un puntaje inferior a este valor se descartan.
  • Search Query: Texto de búsqueda que se enviará al vector store.

Salidas

  • Retriever: Un objeto que puedes usar en otras partes del flujo para realizar búsquedas de forma programática.
  • Search Results: La lista de documentos que cumplen con el puntaje mínimo y están dentro del límite de resultados. Cada documento incluye su contenido y su puntaje.

Ejemplo de Uso

Supongamos que tienes un vector store con artículos de soporte técnico y quieres encontrar los más relevantes sobre “configuración de red” con un puntaje mínimo de 0.7 y solo los 5 mejores resultados.

  1. Conecta el componente Scorer Retriever a tu vector store.
  2. En Search Query escribe: configuración de red.
  3. Pon Score threshold a 0.7.
  4. Pon Number of Results a 5.
  5. Conecta la salida Search Results a un componente de visualización (por ejemplo, un cuadro de texto o una tabla) para mostrar los artículos filtrados.

El flujo mostrará los cinco artículos más relevantes sobre configuración de red, descartando cualquier artículo que no alcance el puntaje de 0.7.

Componentes Relacionados

  • VectorStore: Almacén donde se guardan los documentos en forma de vectores.
  • Retriever: Objeto que permite realizar búsquedas de manera programática en el vector store.
  • Search Query: Entrada de texto que define lo que buscas.

Consejos y Mejores Prácticas

  • Ajusta el Score threshold: Un valor demasiado alto puede devolver pocos resultados; uno demasiado bajo puede incluir documentos poco relevantes.
  • Limita Number of Results: Evita sobrecargar la pantalla o el procesamiento con demasiados documentos.
  • Revisa el vector store: Asegúrate de que los documentos estén bien indexados y actualizados para obtener mejores resultados.
  • Combina con filtros adicionales: Si tu flujo permite, añade filtros por fecha o categoría para refinar aún más la búsqueda.

Consideraciones de Seguridad

  • Privacidad de datos: Los documentos recuperados pueden contener información sensible. Asegúrate de que el vector store esté protegido y que solo usuarios autorizados tengan acceso.
  • Control de acceso: Si el componente se usa en un entorno multiusuario, configura permisos adecuados para que cada usuario solo vea los documentos que le corresponden.
  • Auditoría: Registra las consultas realizadas y los resultados devueltos para poder rastrear el uso y detectar posibles abusos.