Google Generative AI Embeddings
El componente Google Generative AI Embeddings permite transformar cualquier texto en un vector numérico (embedding) utilizando la API de embeddings de Google Gemini. Estos vectores son útiles para tareas como búsqueda semántica, clustering de documentos o análisis de similitud.
¿Cómo funciona?
Cuando configuras el componente, seleccionas la credencial Google Gemini API (que contiene tu Google API Key). El componente envía el texto a la API de Google Generative AI, que devuelve un vector de 1536 dimensiones. Internamente el componente gestiona el envío en lotes (máximo 100 textos por lote) y adapta la respuesta para que sea compatible con LangChain. El resultado es una lista de embeddings, uno por cada texto que enviaste.
Entradas
Antes de usar el componente, debes:
- Configurar la credencial Google Gemini API en la sección de credenciales de Nappai.
- Seleccionar esa credencial en el campo Credential del componente.
Campos de Entrada
- Model Name: Especifica el modelo de embeddings que quieres usar. El valor por defecto es
models/text-embedding-004
. Este campo permite elegir entre los modelos disponibles de Google Gemini que ofrecen embeddings.
Salidas
- Embeddings: Devuelve una lista de vectores numéricos (embeddings) que representan cada texto procesado. Cada vector tiene 1536 dimensiones y puede ser usado directamente en componentes de búsqueda vectorial, clustering o análisis de similitud.
Ejemplo de Uso
- Credencial: En la sección de credenciales de Nappai, crea una credencial llamada
GoogleGeminiAPI
con tu Google API Key. - Componente: Arrastra el componente Google Generative AI Embeddings al flujo.
- Configuración:
- Selecciona la credencial
GoogleGeminiAPI
en el campo Credential. - Deja el campo Model Name con el valor por defecto o cambia a otro modelo si lo prefieres.
- Selecciona la credencial
- Entrada de texto: Conecta la salida de un componente que provea textos (por ejemplo, un componente de entrada de texto o un lector de archivos).
- Salida: Conecta la salida Embeddings a un componente de búsqueda vectorial o a un almacén de embeddings para su posterior uso.
Componentes Relacionados
- Google Generative AI Query – Ejecuta consultas de texto y devuelve respuestas generadas por Gemini.
- Text Embedding – Otro componente que genera embeddings, pero usando modelos de OpenAI o localmente.
- Vector Search – Utiliza embeddings para encontrar documentos similares.
Consejos y Mejores Prácticas
- Usa la credencial: Nunca ingreses la API Key directamente en el flujo; siempre utiliza la credencial configurada en Nappai.
- Controla el tamaño del lote: Si trabajas con muchos textos, el componente ya gestiona lotes de 100, pero puedes ajustar el parámetro
batch_size
si necesitas un control más fino. - Revisa el modelo: Los modelos más recientes suelen ofrecer embeddings de mayor calidad; verifica la documentación de Google para elegir el más adecuado a tu caso.
- Manejo de errores: El componente lanza una excepción si la API devuelve un error; captura esta excepción en tu flujo para manejar fallos de manera elegante.
Consideraciones de Seguridad
- Almacena la API Key de forma segura: Utiliza la sección de credenciales de Nappai para proteger tu clave.
- Limita el acceso: Concede permisos mínimos a la credencial, solo los necesarios para generar embeddings.
- Monitorea el uso: Revisa el consumo de la API en la consola de Google Cloud para evitar cargos inesperados.