Saltearse al contenido

MistralAI Embeddings

MistralAI Embeddings es un componente que convierte textos en vectores numéricos (embeddings) utilizando los modelos de MistralAI. Estos vectores pueden ser usados para búsquedas por similitud, clustering, o cualquier tarea que requiera comparar textos en un espacio vectorial.

¿Cómo funciona?

El componente envía tus textos a la API de MistralAI y recibe de vuelta un vector de características para cada entrada. Internamente, el componente:

  1. Conecta con la API: Usa la URL del endpoint (por defecto https://api.mistral.ai/v1/) y la clave API que has guardado en la credencial.
  2. Envía la solicitud: Cada texto se envía como una petición a la ruta de embeddings del modelo seleccionado (mistral-embed).
  3. Recibe la respuesta: La API devuelve un vector de 1024 dimensiones (o el tamaño que el modelo defina) que representa el contenido semántico del texto.
  4. Entrega el resultado: El componente devuelve una lista de embeddings que pueden ser conectados a otros componentes del flujo.

Entradas

Modo de Mapeo (Mapping Mode)

Este componente cuenta con un modo especial llamado “Mapping Mode” (Modo de Mapeo). Cuando activas este modo mediante el interruptor, se habilita una entrada adicional llamada “Mapping Data” y cada campo de entrada te ofrece tres formas diferentes de proporcionar datos:

  • Fixed (Fijo): Escribes el valor directamente en el campo.
  • Mapped (Mapeado): Conectas la salida de otro componente para usar su resultado como valor.
  • Javascript: Escribes código Javascript para calcular el valor dinámicamente.

Esta flexibilidad te permite crear flujos de trabajo más dinámicos y conectados.

Campos de Entrada

  • API Endpoint: La URL base donde se encuentran los servicios de MistralAI. Si no lo cambias, se usará la URL por defecto.
  • Mapping Mode: Interruptor que habilita el modo de mapeo para procesar varios registros a la vez.
  • Max Concurrent Requests: Número máximo de peticiones simultáneas que el componente enviará a la API. Un valor alto puede acelerar el procesamiento, pero también puede sobrecargar la API.
  • Max Retries: Cuántas veces intentará re-enviar una petición si falla. Ayuda a manejar errores temporales de red o de la API.
  • Model: El modelo de embeddings que se usará. Por defecto está configurado en mistral-embed, que es el modelo recomendado para embeddings de texto.
  • Request Timeout: Tiempo máximo (en segundos) que el componente esperará por una respuesta antes de marcar la petición como fallida.

Nota sobre credenciales
Este componente necesita una credencial de tipo Mistral AI API.

  1. Ve a la sección de credenciales de Nappai y crea una nueva credencial llamada Mistral AI API.
  2. Ingresa tu Mistral API Key que puedes obtener en la consola oficial de Mistral.
  3. En el componente, selecciona esa credencial en el campo Credential.
    La clave API no se mostrará en la lista de entradas para mantenerla segura.

Salidas

  • Embeddings: Una lista de vectores numéricos que representan cada entrada de texto. Puedes usar esta salida para alimentar un almacén vectorial, realizar búsquedas por similitud o cualquier otro proceso que requiera datos vectoriales.

Ejemplo de Uso

  1. Configura la credencial: Crea y selecciona la credencial Mistral AI API.
  2. Añade el componente: Arrastra “MistralAI Embeddings” al flujo.
  3. Conecta la entrada de texto: Conecta la salida de un componente que genere textos (por ejemplo, “Texto de Entrada”) al campo Embeddings del componente.
  4. Activa Mapping Mode (opcional): Si quieres procesar varios textos a la vez, activa el modo de mapeo y conecta una lista de textos.
  5. Ejecuta el flujo: El componente enviará los textos a MistralAI y devolverá los embeddings, que luego puedes pasar a un componente de “Vector Store” o “Similarity Search”.

Componentes Relacionados

  • Text to Embeddings – Convierte textos en embeddings usando modelos locales.
  • Vector Store – Almacena y gestiona embeddings para búsquedas rápidas.
  • Similarity Search – Busca textos similares basándose en embeddings.
  • Data Loader – Carga datos desde archivos o bases de datos para alimentar el flujo.

Consejos y Mejores Prácticas

  • Usa Mapping Mode cuando necesites procesar grandes volúmenes de textos; evita enviar cada texto por separado.
  • Ajusta Max Concurrent Requests según la capacidad de tu plan de MistralAI; valores demasiado altos pueden provocar bloqueos.
  • Configura un Timeout razonable (por ejemplo, 120 segundos) para evitar que peticiones largas bloqueen el flujo.
  • Revisa la política de uso de MistralAI para no exceder los límites de tu plan.
  • Mantén la credencial actualizada; si cambias tu API Key, actualízala en la sección de credenciales.

Consideraciones de Seguridad

  • No expongas la API Key: La clave se almacena en la credencial y no aparece en la interfaz de usuario.
  • Limita el acceso a la credencial: Solo usuarios con permisos de administrador pueden crear o editar credenciales.
  • Monitorea el uso: Revisa los logs de llamadas a la API para detectar patrones inusuales.
  • Usa HTTPS: El endpoint por defecto ya utiliza HTTPS; si cambias el endpoint, asegúrate de que sea seguro.