Saltar al contenido principal

Image Generation

Usa Image Generation cuando quieras que un paso del flujo de trabajo cree imágenes a partir de un prompt y reutilice los activos generados más adelante en el flujo de trabajo. Admite OpenAI (gpt-image-2), xAI Grok Imagine (grok-imagine-image-quality, grok-imagine-image) y Google Gemini alojado (gemini-2.5-flash-image). Selecciona el modelo en el menú desplegable Model en la parte superior del formulario de configuración. Las opciones específicas de OpenAI (Size, Quality, Background, Moderation, Output Format, Output Compression) se ocultan cuando se selecciona un modelo Grok o Gemini. Gemini muestra opciones de relación de aspecto en lugar de los mosaicos de tamaño de OpenAI.

Configuración

OpciónRequeridoDescripción
NameNoEtiqueta del paso en el lienzo del flujo de trabajo.
ModelNoModelo de imagen a usar. Predeterminado: gpt-image-2.
PromptEl texto ingresado en Prompt.
Image Size / Aspect RatioNoOpenAI usa mosaicos de tamaño. Gemini usa relaciones de aspecto como 1:1, 16:9 o 9:16.
Image CountNoNúmero de imágenes a generar.
Image QualityNoNivel de calidad para las imágenes generadas (solo OpenAI).
Image BackgroundNoModo de fondo para la salida de la imagen (solo OpenAI).
Image ModerationNoAjuste de moderación para la solicitud de generación (solo OpenAI).
Output FormatNoFormato de archivo de salida (solo OpenAI).
Output CompressionNoNivel de compresión para los formatos que lo admiten (solo OpenAI).
Charge TypeNoIndica si el paso usa facturación Hosted o Personal.
When the step failsNoControla si el flujo de trabajo debe Terminate Workflow o Continue si este paso falla.
Usa el botón Insert Variable junto a Prompt cuando parte de la descripción de la imagen deba provenir de entradas del flujo de trabajo o de pasos anteriores. Este paso usa pestañas Settings y Output. La pestaña Output muestra las imágenes generadas como una galería después de una ejecución de prueba exitosa.

Salida

Este paso genera un objeto con:
  • settings: el modelo seleccionado más la configuración de generación de imágenes específica del proveedor utilizada para la llamada
  • assets: un arreglo de registros de activos generados
Cada elemento de activo incluye datos de activo subido, como:
  • id
  • file_url
  • file_name
  • file_size
  • file_type
Usa la referencia base de salida para pasar el objeto completo hacia adelante:
{{STEP_IDENTIFIER.output}}
Para referenciar un campo de imagen generada específico, usa una ruta indexada como:
{{step_2.output.assets.0.file_url}}
{{step_2.output.assets.0.file_name}}
Para referenciar los ajustes utilizados por el paso:
{{step_2.output.settings.model}}
{{step_2.output.settings.image_size}}
Las claves exactas de los ajustes dependen del proveedor seleccionado. Las salidas de OpenAI incluyen campos específicos de OpenAI como image_quality, image_background, image_output_format e image_output_compression. Las salidas de Gemini incluyen la relación de aspecto seleccionada en image_size. Las salidas de xAI incluyen el modelo, el proveedor y el conteo de imágenes. Usa el selector de variables después de una ejecución de prueba para confirmar la ruta exacta que quieres insertar.

Ejemplo

Agrega Image Generation a tu flujo de trabajo. Escribe un Prompt detallado como Create a product hero image for a blue insulated water bottle on a clean studio background. Elige un Size o Aspect Ratio, establece Image Count y luego ajusta las opciones específicas del proveedor que estén visibles. Si quieres una salida JPEG o WebP más pequeña, reduce Output Compression. Si dejas Output Format en PNG, ese control de compresión permanece deshabilitado. Haz clic en Run en el encabezado del paso. Después de que termine la ejecución, abre Output para revisar las imágenes devueltas y usa el selector de variables para referenciar los campos de activos generados en pasos posteriores.

Notas

  • Si Output Format es JPEG, Transparent no está disponible en Background (solo OpenAI).
  • Si Output Format es PNG, Output Compression se deshabilita en el editor (solo OpenAI).
  • Cuando se usa un modelo Grok Imagine, las imágenes siempre se devuelven como PNG independientemente del ajuste de Output Format.
  • La generación de imágenes con Gemini es solo alojada en este paso del flujo de trabajo. La generación de imágenes con Gemini en modo Personal/BYOK no es compatible en v1.
  • xAI Grok Imagine se factura a una tarifa fija por imagen (no por token). OpenAI gpt-image-2 se factura por token. Gemini se factura por tokens de entrada más tokens de salida de imágenes generadas.
  • Este paso devuelve registros de activos subidos, no solo bytes de imagen sin procesar.
  • Antes de llamar al proveedor de imágenes, Fetch Hive verifica si tu cuenta ha alcanzado el límite de almacenamiento de tu plan. Si se alcanzó el límite, el paso falla sin generar ni subir nuevas imágenes.
  • Las URL de los archivos generados son útiles cuando un paso posterior necesita pasar una referencia de imagen hacia adelante.
Consulta también: Creación y edición y Pruebas e iteración