Saltar al contenido principal

Image Generation

Image Generation permite que tu agente cree imágenes a partir de prompts de texto durante una conversación o ejecución de flujo de trabajo.

Qué hace

Esta herramienta permite que un agente llame a una función nativa create_image. Fetch Hive ejecuta la función en el lado del servidor contra el servicio de generación de imágenes, lo que evita los límites de tiempo de espera de MCP remoto para trabajos de imagen de larga duración. La API utilizada depende del proveedor principal del agente:
  • Agentes OpenAI — se enrutan a la API de generación de imágenes de OpenAI (gpt-image-2). Fetch Hive fuerza el tamaño y la calidad de imagen del agente a auto para controlar el uso de créditos LLM hospedados.
  • Agentes xAI — se enrutan a Grok Imagine (grok-imagine-image-quality). Las opciones exclusivas de OpenAI (tamaño, calidad, fondo, etc.) se ignoran.
  • Agentes Gemini — enruta las solicitudes hospedadas a Gemini 2.5 Flash Image a través de Vertex AI. La generación de imágenes Gemini personal/BYOK aún no es compatible. Las opciones exclusivas de OpenAI se ignoran.
  • Otros agentes personales — enrutan la generación de imágenes a través de la clave del proveedor OpenAI del espacio de trabajo.
Cuando está habilitada, el agente puede generar una o más imágenes en tiempo de ejecución y devolverlas como URLs permanentes de activos. Admite tanto modelos de facturación hospedados como personales:
  • Hosted — las imágenes se facturan contra el saldo de créditos LLM hospedados de tu espacio de trabajo (no se requiere clave de API).
  • Personal — se usa la clave de proveedor propia de tu espacio de trabajo y se cobra directamente. Los agentes OpenAI y xAI usan su clave de proveedor correspondiente; otros proveedores de agentes personales usan la clave OpenAI del espacio de trabajo para imágenes. La generación de imágenes Gemini personal aún no es compatible.

Agregar la herramienta a un agente

  1. Abre un agente en el editor.
  2. Haz clic en el botón con el tooltip Add MCP Tool or Sub Agent.
  3. En MCP Tools, haz clic en Image Generation.
Después de agregar la herramienta, selecciona el nodo Image Generation para abrir su panel de configuración.

Configuración

OpciónDescripción
Billinghosted usa las credenciales del proveedor administradas por Fetch Hive y las comprobaciones de la billetera LLM hospedada; personal usa la clave de proveedor de tu espacio de trabajo y omite la comprobación previa de la billetera hospedada

Opciones disponibles (expuestas al agente)

El agente controla estos parámetros al llamar a la herramienta:
ParámetroDescripciónValor predeterminado
promptDescripción textual de la imagen deseadaRequerido
nNúmero de imágenes a generar (1–10)1
size1024x1024, 1536x1024, 1024x1536 o autoauto
qualityhigh, medium o lowmedium
output_formatpng, jpeg o webppng
backgroundtransparent, opaque o autoauto
moderationlow o autoauto

Salida

Cada imagen generada se carga al almacenamiento R2 y se devuelve como un registro de activo con una URL pública permanente. El agente recibe las URLs y puede incluirlas en su respuesta. Antes de llamar al proveedor de imágenes, Fetch Hive verifica si tu cuenta ha alcanzado el límite de almacenamiento de su plan. Si se alcanza el límite, la herramienta devuelve un error en lugar de generar nuevas imágenes.

Facturación

  • OpenAI (gpt-image-2): facturación basada en tokens. Los tokens de imagen de entrada, los tokens de texto de entrada y los tokens de salida se registran en la finalización y aparecen en tu panel de uso.
  • xAI (Grok Imagine): facturación por imagen a una tarifa fija por imagen generada. Los campos de tokens se establecen en 0.
  • Gemini (gemini-2.5-flash-image): facturación hospedada por tokens a través de Vertex AI. La generación de imágenes Gemini personal/BYOK aún no es compatible. Los tokens de entrada y los tokens de salida de imagen generada se registran en la finalización para la facturación hospedada.

Casos de uso

  • Generar maquetas de productos o borradores de ilustraciones a partir de un prompt.
  • Crear elementos visuales de apoyo durante una tarea más larga de investigación o redacción.
  • Combinar con Vector Search y SERP para producir informes ricamente ilustrados.

Notas

  • Image Generation funciona con todos los proveedores de LLM admitidos (OpenAI, Anthropic, xAI, Gemini). El contexto y las credenciales viajan en un JWT de corta duración desde Fetch Hive al servicio de imágenes.
  • Para agentes personales cuyo proveedor de LLM no sea OpenAI o xAI, configura una clave de proveedor de OpenAI antes de habilitar Image Generation. La generación de imágenes Gemini personal aún no es compatible.
  • La generación de imágenes del agente es ejecutada por Fetch Hive después de que el modelo emite create_image, por lo que las generaciones de larga duración no están limitadas por los tiempos de espera de MCP remoto del proveedor.
  • Para generar imágenes desde un paso de flujo de trabajo (no un agente), consulta el paso de flujo de trabajo Image Generation.
  • Para agregar o eliminar herramientas de un agente, consulta Creación y configuración.