Text Embedder
El Text Embedder convierte el texto de un mensaje en un vector numérico (embedding) que puede ser usado por otros componentes para tareas como búsqueda semántica, clasificación o clustering. Solo necesitas elegir un modelo de embedding y proporcionar el mensaje que quieres procesar.
¿Cómo funciona?
El componente recibe dos entradas:
- Embedding Model – un objeto que implementa la interfaz de embeddings. Cuando se llama al método
embed_documents
, el modelo devuelve una lista de vectores, uno por documento. - Message – el mensaje cuyo contenido textual se extraerá (
message.text
).
Internamente el componente:
- Extrae el texto del mensaje.
- Llama al método
embed_documents
del modelo con ese texto envuelto en una lista. - Toma el primer vector de la respuesta (el único en este caso) y lo empaqueta junto con el texto original en un objeto
Data
. - Devuelve ese objeto como salida Embedding Data.
No se realizan llamadas externas aparte de la interacción con el modelo de embeddings, por lo que la operación es rápida y local siempre que el modelo esté disponible en el entorno.
Entradas
- Embedding Model: Selecciona el modelo de embeddings que quieres usar (por ejemplo, OpenAI, Hugging Face, etc.). Este modelo debe estar previamente configurado en el dashboard.
- Message: Proporciona el mensaje cuyo texto será convertido en embedding. Puedes arrastrar un componente que genere mensajes o usar un mensaje estático.
Salidas
- Embedding Data: Un objeto
Data
que contiene:text
: el texto original del mensaje.embeddings
: el vector numérico generado por el modelo.
Esta salida puede conectarse a componentes que requieran embeddings, como buscadores semánticos, clasificadores o visualizadores de embeddings.
Ejemplo de Uso
- Arrastra el componente Text Embedder al lienzo.
- Conecta la salida de un componente que genere mensajes (por ejemplo, Message Generator) al campo Message.
- Conecta la salida de un componente de modelo de embeddings (por ejemplo, OpenAI Embedding Model) al campo Embedding Model.
- Conecta la salida Embedding Data a un componente que utilice embeddings, como Semantic Search o Embedding Visualizer.
Con esto, cada vez que se genere un mensaje, el componente creará automáticamente su embedding y lo pasará al siguiente paso del flujo.
Componentes Relacionados
- OpenAI Embedding Model – Configura y gestiona el modelo de embeddings de OpenAI.
- Message Generator – Crea mensajes de texto que pueden ser procesados por el Text Embedder.
- Semantic Search – Busca documentos similares usando embeddings generados.
- Embedding Visualizer – Muestra embeddings en un espacio 2D/3D para análisis exploratorio.
Consejos y Mejores Prácticas
- Usa un modelo de embeddings que coincida con tu dominio: Si trabajas con textos técnicos, elige un modelo entrenado en ese dominio para obtener mejores resultados.
- Controla el tamaño del texto: Los modelos de embeddings suelen tener límites de tokens. Si el mensaje es muy largo, considera truncarlo o dividirlo antes de enviarlo.
- Revisa la política de privacidad: Si usas modelos externos (p. ej., OpenAI), asegúrate de que el texto no contenga información sensible que no quieras enviar a terceros.
Consideraciones de Seguridad
- Datos sensibles: Evita enviar información confidencial a modelos externos a menos que estés seguro de que cumplen con las políticas de privacidad de tu organización.
- Control de acceso: Limita quién puede configurar y ejecutar el componente para evitar el uso indebido de recursos de cómputo o de datos.