NVIDIA Embeddings
NVIDIA Embeddings es un componente que convierte textos en vectores numéricos (embeddings) utilizando modelos de NVIDIA. Estos vectores pueden usarse para búsquedas por similitud, clustering, clasificación y otras tareas de procesamiento de lenguaje natural dentro de tu dashboard de Nappai.
¿Cómo funciona?
Cuando configuras el componente, seleccionas un modelo de NVIDIA (por ejemplo, nvidia/nv-embed-v1
) y proporcionas la URL base de la API de NVIDIA. El componente envía el texto que recibe a la API de NVIDIA, que devuelve un vector de características. Internamente, el componente utiliza la librería langchain-nvidia-ai-endpoints
para manejar la comunicación con la API y convertir la respuesta en un objeto de tipo Embeddings que puede ser usado por otros componentes de tu flujo.
Entradas
Campos de Entrada
- NVIDIA Base URL: La dirección del endpoint de NVIDIA que se usará para enviar las peticiones. Por defecto es
https://integrate.api.nvidia.com/v1
, pero puedes cambiarla si usas un entorno diferente. - Model: El modelo de embeddings que quieres usar. Puedes elegir entre
nvidia/nv-embed-v1
osnowflake/arctic-embed-I
. El modelo seleccionado determina la calidad y el tipo de vector que se generará. - Model Temperature: Controla la aleatoriedad de la generación. Para embeddings, normalmente se mantiene bajo (por ejemplo, 0.1) para obtener resultados consistentes.
Credencial
Este componente necesita una credencial de tipo NVIDIA API.
- Ve a la sección de credenciales de Nappai y crea una credencial llamada “NVIDIA API”, ingresando tu NVIDIA API Key.
- En el componente, selecciona esa credencial en el campo Credential.
(Los campos de la credencial, como la API Key, no se muestran aquí.)
Salidas
- Embeddings: Un objeto que contiene el vector resultante del modelo seleccionado. Este vector puede conectarse a otros componentes, como un motor de búsqueda por similitud o un clasificador.
Ejemplo de Uso
- Configura la credencial: Crea la credencial “NVIDIA API” con tu API Key y selecciónala en el componente.
- Selecciona el modelo: Elige
nvidia/nv-embed-v1
para embeddings de alta calidad. - Define la URL base: Deja el valor por defecto o cambia a tu entorno personalizado.
- Ajusta la temperatura: Manténla en 0.1 para resultados consistentes.
- Conecta la salida: Usa el campo Embeddings como entrada para un componente de búsqueda por similitud o para almacenar los vectores en una base de datos.
Componentes Relacionados
- OpenAI Embeddings – Genera embeddings usando modelos de OpenAI.
- Azure OpenAI Embeddings – Embeddings con modelos alojados en Azure.
- Google Vertex AI Embeddings – Embeddings con la plataforma Vertex AI de Google.
Consejos y Mejores Prácticas
- Mantén la temperatura baja: Para embeddings, valores cercanos a 0.1 garantizan consistencia.
- Elige el modelo adecuado:
nvidia/nv-embed-v1
suele ofrecer mayor precisión, perosnowflake/arctic-embed-I
puede ser más rápido. - Revisa el límite de tokens: Asegúrate de que el texto que envías no exceda el límite de tokens del modelo.
- Cachea resultados: Si procesas el mismo texto repetidamente, guarda los embeddings para evitar llamadas innecesarias a la API.
Consideraciones de Seguridad
- Protege tu API Key: La credencial NVIDIA API debe mantenerse confidencial. No la compartas en código público.
- Limita el acceso: Configura permisos en Nappai para que solo usuarios autorizados puedan usar la credencial.
- Monitorea el uso: Revisa los logs de llamadas a la API para detectar cualquier uso inesperado.