Saltearse al contenido

Gemini Image Generator

Gemini Image Generator te permite crear imágenes a partir de descripciones de texto y de archivos de imagen existentes. Conecta este componente en tu dashboard y elige un modelo de Gemini para generar imágenes de alta calidad en segundos.

¿Cómo funciona?

Cuando activas Gemini Image Generator, el componente envía una solicitud a la API de Google Gemini. Le das una descripción (Prompt) y, opcionalmente, archivos de imagen que sirvan como referencia. Gemini procesa la información y devuelve una o varias imágenes generadas. El componente también puede transformarse en una herramienta que un agente de IA pueda usar dentro de un flujo de trabajo más amplio.

Modo de Mapeo (Mapping Mode)

Este componente cuenta con un modo especial llamado Mapping Mode (Modo de Mapeo). Cuando activas este modo mediante el interruptor, se habilita una entrada adicional llamada Mapping Data y cada campo de entrada te ofrece tres formas diferentes de proporcionar datos:

  • Fixed (Fijo): Escribes el valor directamente en el campo.
  • Mapped (Mapeado): Conectas la salida de otro componente para usar su resultado como valor.
  • Javascript: Escribes código Javascript para calcular el valor dinámicamente.

Esta flexibilidad te permite crear flujos de trabajo más dinámicos y conectados.

Campos de Entrada

Los siguientes campos están disponibles para configurar este componente. Cada campo puede ser usado en cualquier operación (el componente no tiene operaciones distintas).

  • Image Files: La lista de archivos de imagen (URL o ID de archivo) que se usarán como referencia para la generación.
  • Aspect Ratio: El aspecto de la imagen. Los valores válidos son 1:1, 3:4, 4:3, 9:16 y 16:9.
  • Mapping Mode: Activa el modo de mapeo para procesar varios registros en lote.
  • Image Model: El nombre del modelo Gemini que se usará.
  • Number of Images: La cantidad de imágenes que quieres generar.
  • Prompt: Una descripción de texto de la imagen deseada. El máximo es de 4000 caracteres.
  • Tool Name: El nombre que aparecerá cuando este componente se use como herramienta en un agente.
  • Tool Description: Una descripción detallada de lo que hace esta herramienta.
  • Tools arguments metadata: Define los metadatos de los argumentos que la herramienta aceptará.

Credencial
Este componente necesita una credencial de tipo Google Gemini API.

  1. Ve a la sección de credenciales de Nappai y crea una nueva credencial llamada Google Gemini API.
  2. Ingresa tu Google Api Key (es un campo de tipo password).
  3. En el componente, selecciona la credencial que acabas de crear en el campo Credential.

Salidas

  • Image: Devuelve la imagen generada en formato binario (puedes guardarla o usarla en otro componente).
  • Tool: Convierte el componente en una herramienta que un agente de IA puede invocar; incluye los metadatos necesarios para que el agente sepa cómo usarlo.

Ejemplo de Uso

  1. Configura la credencial: Asegúrate de haber creado y seleccionado la credencial Google Gemini API.
  2. Define el Prompt: Escribe “Un atardecer sobre la playa con palmeras y un barco de vela”.
  3. Elige el Aspect Ratio: Selecciona 16:9.
  4. Número de Imágenes: Pon 1.
  5. Modelo: Elige el modelo más reciente disponible.
  6. Ejecuta: Haz clic en “Run” y espera a que Gemini genere la imagen.
  7. Usa la salida: Conecta la salida Image a un componente de visualización o a un flujo de guardado de archivos.

Si necesitas generar imágenes para cada registro de una tabla, activa Mapping Mode, conecta la columna que contiene la descripción de cada registro al campo Prompt y deja el resto de los campos en modo fijo. Gemini procesará cada registro y devolverá una imagen por cada entrada.

Componentes Relacionados

  • BaseGeminiImageGenerator: La clase base que maneja la lógica de conexión con Gemini.
  • Image Viewer: Muestra la imagen generada en el dashboard.
  • File Storage: Guarda la imagen en tu sistema de archivos o en la nube.

Consejos y Mejores Prácticas

  • Limita el Prompt: Mantén la descripción clara y concisa; más de 4000 caracteres no son aceptados.
  • Usa Aspect Ratio correcto: Elige el ratio que mejor se adapte al uso final (por ejemplo, 9:16 para stories de Instagram).
  • Prueba con un solo Prompt primero: Antes de activar Mapping Mode, verifica que el modelo genere la imagen esperada.
  • Controla el número de imágenes: Generar muchas imágenes a la vez puede consumir tu cuota de API rápidamente.
  • Revisa la documentación de Gemini: Los modelos pueden cambiar; consulta la guía oficial para conocer los límites de tokens y de tamaño de imagen.

Consideraciones de Seguridad

  • Protege tu API Key: No la compartas públicamente y almacénala en la sección de credenciales de Nappai.
  • Limita el acceso: Solo los usuarios autorizados deben poder ejecutar este componente, ya que consume recursos de la API de Google.
  • Monitorea el uso: Revisa el consumo de la API en la consola de Google Cloud para evitar sobrepasar tu cuota.