Image Generation

当你希望工作流步骤根据提示词创建图像并在工作流后续中重用生成的资源时,请使用 Image Generation。支持 OpenAI(gpt-image-2)、xAI Grok Imagine(grok-imagine-image-quality、grok-imagine-image)和托管的 Google Gemini(gemini-2.5-flash-image)。在设置表单顶部的 Model 下拉菜单中选择模型。当选择 Grok 或 Gemini 模型时,OpenAI 专用选项(Size、Quality、Background、Moderation、Output Format、Output Compression)会被隐藏。Gemini 显示宽高比选项而不是 OpenAI 的尺寸瓦片。

配置

选项	是否必填	说明
Name	否	步骤在工作流画布中的标签。
Model	否	使用的图像模型。默认值:`gpt-image-2`。
Prompt	是	在 Prompt 中输入的文本。
Image Size / Aspect Ratio	否	OpenAI 使用尺寸瓦片。Gemini 使用宽高比,例如 `1:1`、`16:9` 或 `9:16`。
Image Count	否	要生成的图像数量。
Image Quality	否	生成图像的质量级别(仅限 OpenAI)。
Image Background	否	图像输出的背景模式(仅限 OpenAI)。
Image Moderation	否	生成请求的内容审核设置(仅限 OpenAI)。
Output Format	否	输出文件格式(仅限 OpenAI)。
Output Compression	否	支持压缩的格式的压缩级别(仅限 OpenAI)。
Charge Type	否	步骤使用 Hosted 还是 Personal 计费。
When the step fails	否	控制此步骤失败时工作流应 Terminate Workflow 还是 Continue。

当部分图像描述应来自工作流输入或早前步骤时,使用 Prompt 旁边的 Insert Variable 按钮。此步骤使用 Settings 和 Output 标签。Output 标签在成功测试运行后将生成的图像作为图库显示。

输出

此步骤输出一个对象,包含:

settings:所选模型以及调用使用的提供商专用图像生成设置
assets:生成的资源记录数组

每个资源条目包含已上传的资源数据,例如:

id
file_url
file_name
file_size
file_type

使用基础输出引用向前传递整个对象:

{{STEP_IDENTIFIER.output}}

要引用特定的生成图像字段,使用索引路径,例如:

{{step_2.output.assets.0.file_url}}
{{step_2.output.assets.0.file_name}}

要引用步骤使用的设置:

{{step_2.output.settings.model}}
{{step_2.output.settings.image_size}}

具体设置键取决于所选提供商。OpenAI 输出包括 OpenAI 专用字段,例如 image_quality、image_background、image_output_format 和 image_output_compression。Gemini 输出在 image_size 中包括所选宽高比。xAI 输出包括模型、提供商和图像数量。在测试运行后使用变量选择器以确认要插入的确切路径。

示例

将 Image Generation 添加到你的工作流。撰写详细的 Prompt,例如 Create a product hero image for a blue insulated water bottle on a clean studio background。选择 Size 或 Aspect Ratio,设置 Image Count,然后调整可见的提供商专用选项。如果你希望更小的 JPEG 或 WebP 输出,降低 Output Compression。如果保持 Output Format 为 PNG,则该压缩控件保持禁用。点击步骤标题中的 Run。运行完成后,打开 Output 查看返回的图像,并使用变量选择器在后续步骤中引用生成的资源字段。

备注

如果 Output Format 为 JPEG,Background 中无法使用 Transparent(仅限 OpenAI)。
如果 Output Format 为 PNG,编辑器中的 Output Compression 会被禁用(仅限 OpenAI)。
使用 Grok Imagine 模型时,无论 Output Format 设置如何,图像始终以 PNG 格式返回。
Gemini 图像生成在此工作流步骤中仅支持托管模式。v1 不支持个人/BYOK 的 Gemini 图像生成。
xAI Grok Imagine 按每张图像的固定费率计费(不按 token)。OpenAI gpt-image-2 按 token 计费。Gemini 按输入 token 加生成图像输出 token 计费。
此步骤返回已上传的资源记录,而不仅仅是原始图像字节。
在调用图像提供商之前,Fetch Hive 会检查你的账户是否已达到套餐存储限制。如果达到限制,步骤将失败,不会生成或上传新图像。
当后续步骤需要向前传递图像引用时,生成的文件 URL 很有用。

另见:创建和编辑和测试与迭代

​Image Generation

​配置

​输出

​示例

​备注

Image Generation

配置

输出

示例

备注