Image Generation

Usa Image Generation cuando quieras que un paso del flujo de trabajo cree imágenes a partir de un prompt y reutilice los activos generados más adelante en el flujo de trabajo. Admite OpenAI (gpt-image-2), xAI Grok Imagine (grok-imagine-image-quality, grok-imagine-image) y Google Gemini alojado (gemini-2.5-flash-image). Selecciona el modelo en el menú desplegable Model en la parte superior del formulario de configuración. Las opciones específicas de OpenAI (Size, Quality, Background, Moderation, Output Format, Output Compression) se ocultan cuando se selecciona un modelo Grok o Gemini. Gemini muestra opciones de relación de aspecto en lugar de los mosaicos de tamaño de OpenAI.

Configuración

Opción	Requerido	Descripción
Name	No	Etiqueta del paso en el lienzo del flujo de trabajo.
Model	No	Modelo de imagen a usar. Predeterminado: `gpt-image-2`.
Prompt	Sí	El texto ingresado en Prompt.
Image Size / Aspect Ratio	No	OpenAI usa mosaicos de tamaño. Gemini usa relaciones de aspecto como `1:1`, `16:9` o `9:16`.
Image Count	No	Número de imágenes a generar.
Image Quality	No	Nivel de calidad para las imágenes generadas (solo OpenAI).
Image Background	No	Modo de fondo para la salida de la imagen (solo OpenAI).
Image Moderation	No	Ajuste de moderación para la solicitud de generación (solo OpenAI).
Output Format	No	Formato de archivo de salida (solo OpenAI).
Output Compression	No	Nivel de compresión para los formatos que lo admiten (solo OpenAI).
Charge Type	No	Indica si el paso usa facturación Hosted o Personal.
When the step fails	No	Controla si el flujo de trabajo debe Terminate Workflow o Continue si este paso falla.

Usa el botón Insert Variable junto a Prompt cuando parte de la descripción de la imagen deba provenir de entradas del flujo de trabajo o de pasos anteriores. Este paso usa pestañas Settings y Output. La pestaña Output muestra las imágenes generadas como una galería después de una ejecución de prueba exitosa.

Salida

Este paso genera un objeto con:

settings: el modelo seleccionado más la configuración de generación de imágenes específica del proveedor utilizada para la llamada
assets: un arreglo de registros de activos generados

Cada elemento de activo incluye datos de activo subido, como:

id
file_url
file_name
file_size
file_type

Usa la referencia base de salida para pasar el objeto completo hacia adelante:

{{STEP_IDENTIFIER.output}}

Para referenciar un campo de imagen generada específico, usa una ruta indexada como:

{{step_2.output.assets.0.file_url}}
{{step_2.output.assets.0.file_name}}

Para referenciar los ajustes utilizados por el paso:

{{step_2.output.settings.model}}
{{step_2.output.settings.image_size}}

Las claves exactas de los ajustes dependen del proveedor seleccionado. Las salidas de OpenAI incluyen campos específicos de OpenAI como image_quality, image_background, image_output_format e image_output_compression. Las salidas de Gemini incluyen la relación de aspecto seleccionada en image_size. Las salidas de xAI incluyen el modelo, el proveedor y el conteo de imágenes. Usa el selector de variables después de una ejecución de prueba para confirmar la ruta exacta que quieres insertar.

Ejemplo

Agrega Image Generation a tu flujo de trabajo. Escribe un Prompt detallado como Create a product hero image for a blue insulated water bottle on a clean studio background. Elige un Size o Aspect Ratio, establece Image Count y luego ajusta las opciones específicas del proveedor que estén visibles. Si quieres una salida JPEG o WebP más pequeña, reduce Output Compression. Si dejas Output Format en PNG, ese control de compresión permanece deshabilitado. Haz clic en Run en el encabezado del paso. Después de que termine la ejecución, abre Output para revisar las imágenes devueltas y usa el selector de variables para referenciar los campos de activos generados en pasos posteriores.

Notas

Si Output Format es JPEG, Transparent no está disponible en Background (solo OpenAI).
Si Output Format es PNG, Output Compression se deshabilita en el editor (solo OpenAI).
Cuando se usa un modelo Grok Imagine, las imágenes siempre se devuelven como PNG independientemente del ajuste de Output Format.
La generación de imágenes con Gemini es solo alojada en este paso del flujo de trabajo. La generación de imágenes con Gemini en modo Personal/BYOK no es compatible en v1.
xAI Grok Imagine se factura a una tarifa fija por imagen (no por token). OpenAI gpt-image-2 se factura por token. Gemini se factura por tokens de entrada más tokens de salida de imágenes generadas.
Este paso devuelve registros de activos subidos, no solo bytes de imagen sin procesar.
Antes de llamar al proveedor de imágenes, Fetch Hive verifica si tu cuenta ha alcanzado el límite de almacenamiento de tu plan. Si se alcanzó el límite, el paso falla sin generar ni subir nuevas imágenes.
Las URL de los archivos generados son útiles cuando un paso posterior necesita pasar una referencia de imagen hacia adelante.

Consulta también: Creación y edición y Pruebas e iteración

​Image Generation

​Configuración

​Salida

​Ejemplo

​Notas

Image Generation

Configuración

Salida

Ejemplo

Notas