Saltearse al contenido

NVIDIA Embeddings

NVIDIA Embeddings es un componente que convierte textos en vectores numéricos (embeddings) utilizando modelos de NVIDIA. Estos vectores pueden usarse para búsquedas por similitud, clustering, clasificación y otras tareas de procesamiento de lenguaje natural dentro de tu dashboard de Nappai.

¿Cómo funciona?

Cuando configuras el componente, seleccionas un modelo de NVIDIA (por ejemplo, nvidia/nv-embed-v1) y proporcionas la URL base de la API de NVIDIA. El componente envía el texto que recibe a la API de NVIDIA, que devuelve un vector de características. Internamente, el componente utiliza la librería langchain-nvidia-ai-endpoints para manejar la comunicación con la API y convertir la respuesta en un objeto de tipo Embeddings que puede ser usado por otros componentes de tu flujo.

Entradas

Campos de Entrada

  • NVIDIA Base URL: La dirección del endpoint de NVIDIA que se usará para enviar las peticiones. Por defecto es https://integrate.api.nvidia.com/v1, pero puedes cambiarla si usas un entorno diferente.
  • Model: El modelo de embeddings que quieres usar. Puedes elegir entre nvidia/nv-embed-v1 o snowflake/arctic-embed-I. El modelo seleccionado determina la calidad y el tipo de vector que se generará.
  • Model Temperature: Controla la aleatoriedad de la generación. Para embeddings, normalmente se mantiene bajo (por ejemplo, 0.1) para obtener resultados consistentes.

Credencial
Este componente necesita una credencial de tipo NVIDIA API.

  1. Ve a la sección de credenciales de Nappai y crea una credencial llamada “NVIDIA API”, ingresando tu NVIDIA API Key.
  2. En el componente, selecciona esa credencial en el campo Credential.
    (Los campos de la credencial, como la API Key, no se muestran aquí.)

Salidas

  • Embeddings: Un objeto que contiene el vector resultante del modelo seleccionado. Este vector puede conectarse a otros componentes, como un motor de búsqueda por similitud o un clasificador.

Ejemplo de Uso

  1. Configura la credencial: Crea la credencial “NVIDIA API” con tu API Key y selecciónala en el componente.
  2. Selecciona el modelo: Elige nvidia/nv-embed-v1 para embeddings de alta calidad.
  3. Define la URL base: Deja el valor por defecto o cambia a tu entorno personalizado.
  4. Ajusta la temperatura: Manténla en 0.1 para resultados consistentes.
  5. Conecta la salida: Usa el campo Embeddings como entrada para un componente de búsqueda por similitud o para almacenar los vectores en una base de datos.

Componentes Relacionados

  • OpenAI Embeddings – Genera embeddings usando modelos de OpenAI.
  • Azure OpenAI Embeddings – Embeddings con modelos alojados en Azure.
  • Google Vertex AI Embeddings – Embeddings con la plataforma Vertex AI de Google.

Consejos y Mejores Prácticas

  • Mantén la temperatura baja: Para embeddings, valores cercanos a 0.1 garantizan consistencia.
  • Elige el modelo adecuado: nvidia/nv-embed-v1 suele ofrecer mayor precisión, pero snowflake/arctic-embed-I puede ser más rápido.
  • Revisa el límite de tokens: Asegúrate de que el texto que envías no exceda el límite de tokens del modelo.
  • Cachea resultados: Si procesas el mismo texto repetidamente, guarda los embeddings para evitar llamadas innecesarias a la API.

Consideraciones de Seguridad

  • Protege tu API Key: La credencial NVIDIA API debe mantenerse confidencial. No la compartas en código público.
  • Limita el acceso: Configura permisos en Nappai para que solo usuarios autorizados puedan usar la credencial.
  • Monitorea el uso: Revisa los logs de llamadas a la API para detectar cualquier uso inesperado.