Saltearse al contenido

CohereEmbeddings

CohereEmbeddings es un componente que convierte textos en vectores numéricos (embeddings) utilizando los modelos de Cohere. Estos vectores pueden emplearse para búsquedas semánticas, clasificación, clustering y otras tareas de procesamiento de lenguaje natural dentro del dashboard de Nappai.

¿Cómo funciona?

Cuando activas el componente, Nappai envía el texto que quieres procesar a la API de Cohere. La API devuelve un vector de números que representa el significado del texto. El componente simplemente pasa ese vector a la siguiente etapa de tu flujo de trabajo. No necesitas preocuparte por la infraestructura; todo lo que debes hacer es configurar la credencial y elegir el modelo que mejor se adapte a tu caso.

Entradas

Modo de Mapeo (Mapping Mode)

Este componente cuenta con un modo especial llamado “Mapping Mode” (Modo de Mapeo). Cuando activas este modo mediante el interruptor, se habilita una entrada adicional llamada “Mapping Data” y cada campo de entrada te ofrece tres formas diferentes de proporcionar datos:

  • Fixed (Fijo): Escribes el valor directamente en el campo.
  • Mapped (Mapeado): Conectas la salida de otro componente para usar su resultado como valor.
  • Javascript: Escribes código Javascript para calcular el valor dinámicamente.

Esta flexibilidad te permite crear flujos de trabajo más dinámicos y conectados.

Campos de Entrada

Los siguientes campos están disponibles para configurar este componente. Cada campo puede ser configurado de las tres formas descritas arriba.

  • Mapping Mode: Activa el modo de mapeo para procesar varios registros a la vez.
  • Max Retries: Número máximo de intentos que el componente realizará si la llamada a la API falla.
  • Model: Selecciona el modelo de Cohere que se usará para generar los embeddings. Los modelos disponibles son:
    • embed-english-v2.0
    • embed-multilingual-v2.0
    • embed-english-light-v2.0
    • embed-multilingual-light-v2.0
  • Request Timeout: Tiempo máximo (en segundos) que el componente esperará antes de cancelar la solicitud a la API.
  • Truncate: Parámetro opcional que indica cómo truncar textos muy largos antes de enviarlos a la API.
  • User Agent: Identificador que se envía en la cabecera de la solicitud HTTP. Por defecto es langchain.

Nota: Antes de usar el componente, debes configurar una credencial de tipo Cohere API en la sección de credenciales de Nappai y seleccionarla en el campo “Credential” del componente.

Salidas

  • Embeddings: Un vector numérico que representa el texto procesado. Este vector puede ser usado como entrada para otros componentes, como búsqueda por similitud o clasificación.

Ejemplo de Uso

  1. Configura la credencial
    Ve a la sección de credenciales de Nappai, crea una nueva credencial de tipo Cohere API y pega tu Cohere Api Key. Luego, en el componente, selecciona esa credencial en el campo “Credential”.

  2. Selecciona el modelo
    En el campo Model, elige embed-english-v2.0 si trabajas con textos en inglés. Si necesitas soporte multilingüe, elige embed-multilingual-v2.0.

  3. Define el texto a procesar
    Conecta la salida de un componente que genere texto (por ejemplo, un extractor de contenido de un documento) al campo Mapping Data (si usas Mapping Mode) o escribe directamente el texto en el campo Fixed.

  4. Ejecuta el flujo
    Al ejecutar el flujo, el componente enviará el texto a Cohere y devolverá el vector de embeddings. Puedes usar este vector en un componente de búsqueda por similitud para encontrar documentos similares.

Componentes Relacionados

  • OpenAIEmbeddings – Genera embeddings usando los modelos de OpenAI. Útil si prefieres la infraestructura de OpenAI.
  • SentenceTransformerEmbeddings – Usa modelos de Hugging Face para embeddings. Ideal para casos donde se necesita mayor personalización de modelos.
  • VectorStore – Almacena y consulta embeddings. Se suele usar junto con cualquier componente de embeddings para crear índices de búsqueda.

Consejos y Mejores Prácticas

  • Elige el modelo correcto: Los modelos “light” son más rápidos y económicos, pero pueden ofrecer menor precisión que los modelos “v2.0”.
  • Controla el tamaño del texto: Si tus textos superan el límite de tokens, usa el parámetro Truncate o divide el texto en fragmentos.
  • Gestiona los errores: Ajusta Max Retries y Request Timeout según la estabilidad de tu conexión y la criticidad de la tarea.
  • Revisa la política de uso: Asegúrate de que tu uso de la API de Cohere cumpla con sus términos de servicio.

Consideraciones de Seguridad

  • Protege tu API Key: La credencial de Cohere debe mantenerse confidencial. No la compartas en flujos públicos ni la incluyas en archivos de código.
  • Limita el acceso: Configura permisos de usuario en Nappai para que solo las personas autorizadas puedan ver o modificar la credencial.
  • Monitorea el uso: Revisa el consumo de la API en la consola de Cohere para detectar cualquier anomalía o uso inesperado.