Saltearse al contenido

Text Embedder

El Text Embedder convierte el texto de un mensaje en un vector numérico (embedding) que puede ser usado por otros componentes para tareas como búsqueda semántica, clasificación o clustering. Solo necesitas elegir un modelo de embedding y proporcionar el mensaje que quieres procesar.

¿Cómo funciona?

El componente recibe dos entradas:

  1. Embedding Model – un objeto que implementa la interfaz de embeddings. Cuando se llama al método embed_documents, el modelo devuelve una lista de vectores, uno por documento.
  2. Message – el mensaje cuyo contenido textual se extraerá (message.text).

Internamente el componente:

  • Extrae el texto del mensaje.
  • Llama al método embed_documents del modelo con ese texto envuelto en una lista.
  • Toma el primer vector de la respuesta (el único en este caso) y lo empaqueta junto con el texto original en un objeto Data.
  • Devuelve ese objeto como salida Embedding Data.

No se realizan llamadas externas aparte de la interacción con el modelo de embeddings, por lo que la operación es rápida y local siempre que el modelo esté disponible en el entorno.

Entradas

  • Embedding Model: Selecciona el modelo de embeddings que quieres usar (por ejemplo, OpenAI, Hugging Face, etc.). Este modelo debe estar previamente configurado en el dashboard.
  • Message: Proporciona el mensaje cuyo texto será convertido en embedding. Puedes arrastrar un componente que genere mensajes o usar un mensaje estático.

Salidas

  • Embedding Data: Un objeto Data que contiene:
    • text: el texto original del mensaje.
    • embeddings: el vector numérico generado por el modelo.

Esta salida puede conectarse a componentes que requieran embeddings, como buscadores semánticos, clasificadores o visualizadores de embeddings.

Ejemplo de Uso

  1. Arrastra el componente Text Embedder al lienzo.
  2. Conecta la salida de un componente que genere mensajes (por ejemplo, Message Generator) al campo Message.
  3. Conecta la salida de un componente de modelo de embeddings (por ejemplo, OpenAI Embedding Model) al campo Embedding Model.
  4. Conecta la salida Embedding Data a un componente que utilice embeddings, como Semantic Search o Embedding Visualizer.

Con esto, cada vez que se genere un mensaje, el componente creará automáticamente su embedding y lo pasará al siguiente paso del flujo.

Componentes Relacionados

  • OpenAI Embedding Model – Configura y gestiona el modelo de embeddings de OpenAI.
  • Message Generator – Crea mensajes de texto que pueden ser procesados por el Text Embedder.
  • Semantic Search – Busca documentos similares usando embeddings generados.
  • Embedding Visualizer – Muestra embeddings en un espacio 2D/3D para análisis exploratorio.

Consejos y Mejores Prácticas

  • Usa un modelo de embeddings que coincida con tu dominio: Si trabajas con textos técnicos, elige un modelo entrenado en ese dominio para obtener mejores resultados.
  • Controla el tamaño del texto: Los modelos de embeddings suelen tener límites de tokens. Si el mensaje es muy largo, considera truncarlo o dividirlo antes de enviarlo.
  • Revisa la política de privacidad: Si usas modelos externos (p. ej., OpenAI), asegúrate de que el texto no contenga información sensible que no quieras enviar a terceros.

Consideraciones de Seguridad

  • Datos sensibles: Evita enviar información confidencial a modelos externos a menos que estés seguro de que cumplen con las políticas de privacidad de tu organización.
  • Control de acceso: Limita quién puede configurar y ejecutar el componente para evitar el uso indebido de recursos de cómputo o de datos.