Saltearse al contenido

Describe Image

Describe Image es un componente sencillo que permite a los usuarios obtener una descripción textual de una imagen mediante un modelo de lenguaje. Solo necesitas cargar la imagen, elegir un modelo y, opcionalmente, ajustar el tamaño de la imagen antes de que el sistema genere la descripción.

¿Cómo funciona?

Cuando activas el componente, Nappai toma la imagen que le indiques (puede ser una URL, un archivo local o un objeto con la clave url) y la envía a un modelo de lenguaje (LLM) a través de la clase ImageAnalyzer. El modelo procesa la imagen y devuelve una descripción basada en el texto de prompt que hayas proporcionado. Si seleccionas una opción de redimensionamiento, la imagen se ajusta antes de enviarse al modelo para optimizar el rendimiento y la calidad de la descripción.

Entradas

  • Image Data: Imagen que quieres describir. Puedes introducirla como texto, un objeto con la clave url o una lista de objetos.
  • Model: Modelo de lenguaje que se utilizará para generar la descripción. Este campo es obligatorio.
  • Image/s Path: Ruta o URL de la imagen(s) a describir. Se usa cuando la imagen no está directamente en el campo Image Data.
  • Prompt Text: Texto que guía al modelo sobre cómo describir la imagen. El valor por defecto es “Describe the image.”
  • Resize Image: Opción para cambiar el tamaño de la imagen antes de enviarla al modelo. Puedes elegir mantener el tamaño original o redimensionar a 255 × 255 o 512 × 512 píxeles.

Salidas

  • Data: Lista de objetos Data que contienen la descripción generada por el modelo. Cada elemento incluye el texto descriptivo y metadatos adicionales que pueden ser útiles para otros componentes del flujo.

Ejemplo de Uso

  1. Carga la imagen: Arrastra y suelta una imagen en el campo Image Data o escribe la URL en Image/s Path.
  2. Selecciona el modelo: Elige el modelo de lenguaje que prefieras en el campo Model.
  3. Define el prompt (opcional): Si quieres una descripción más específica, escribe un prompt personalizado en Prompt Text.
  4. Ajusta el tamaño (opcional): Si la imagen es muy grande, selecciona “255x255” o “512x512” en Resize Image.
  5. Ejecuta el componente: Haz clic en “Run” y espera a que Nappai devuelva la descripción en la salida Data.
  6. Utiliza la salida: Conecta la salida Data a otro componente, por ejemplo, un cuadro de texto o un generador de informes, para mostrar la descripción al usuario final.

Componentes Relacionados

  • ImageLoader – Permite cargar imágenes desde distintas fuentes antes de pasarlas a Describe Image.
  • ImageAnalyzer – Biblioteca interna que se encarga de procesar la imagen y comunicarse con el modelo de lenguaje.
  • TextGenerator – Puede combinarse con Describe Image para crear textos más elaborados a partir de la descripción generada.

Consejos y Mejores Prácticas

  • Elige el modelo adecuado: Los modelos más grandes suelen generar descripciones más detalladas, pero consumen más recursos.
  • Mantén el tamaño original cuando necesites precisión en detalles finos; usa la opción de redimensionamiento solo si el rendimiento es una preocupación.
  • Revisa el prompt: Un prompt claro y específico ayuda al modelo a enfocarse en los aspectos que realmente te interesan.
  • Conecta la salida a un componente de visualización para que los usuarios finales vean la descripción directamente en el dashboard.

Consideraciones de Seguridad

  • Privacidad de las imágenes: Las imágenes se envían al modelo de lenguaje, por lo que es importante asegurarse de que no contengan datos sensibles o personales sin el consentimiento adecuado.
  • Control de acceso: Limita el uso de este componente a usuarios con permisos de lectura/escritura en los recursos de imagen.
  • Registros: Evita registrar la imagen completa en logs; solo guarda la descripción generada si es necesario para auditoría.