如何在 n8n 中自动生成 AI 图像和视频

在 n8n 中通过触发器、HTTP 请求、轮询、存储以及 Atlas Cloud 包含 300 多种模型的统一 API,实现 AI 图像和视频生成的自动化。

如何在 n8n 中自动生成 AI 图像和视频

在 n8n 中实现 AI 图像和视频生成自动化的最快方法是构建一个工作流:接收提示词 (prompt)、调用生成 API、在必要时等待结果,然后保存或发布生成的资源。

对于图像,工作流通常可以直接执行:触发器、提示词、API 调用、保存输出。对于视频,工作流通常需要一个额外的作业状态轮询循环,因为许多视频 API 会先返回一个作业 ID,稍后再返回最终的视频 URL。

本指南将演示如何在 n8n 中构建这两种工作流,以及何时使用 OpenAI 节点、何时使用 HTTP Request 节点,以及 Atlas Cloud 如何通过统一的 API 层简化需要多种图像和视频模型的生产级工作流。

快速解答:n8n 自动化模式

n8n 中的大多数 AI 图像和视频生成工作流都遵循相同的五步模式:

  1. 选择一个触发器,例如定时触发器 (Schedule Trigger)、Webhook、Google Sheets、Airtable、Slack 或表单。
  2. 在“编辑字段”(Edit Fields) 节点中准备提示词和生成设置。
  3. 使用 OpenAI 节点或 HTTP Request 节点调用图像或视频生成 API。
  4. 如果生成任务是异步的,则进行等待或轮询。
  5. 将输出保存到 Google Drive、S3、CMS、Slack、电子邮件或其他发布目的地。

关键区别在于时效性。图像生成通常可以在同一个工作流路径中返回文件 URL 或二进制结果。而视频生成通常需要提交作业步骤、Wait 节点、状态检查请求以及最终的下载步骤。

你应该使用哪种 n8n 路径?

n8n 提供了两种实用的方式来自动化 AI 媒体生成。当操作受支持时,请使用原生应用节点;当需要自定义端点、额外的模型提供商或统一的 API 时,请使用 HTTP Request 节点。

路径最适合图像视频API 灵活性
OpenAI 节点OpenAI 任务
HTTP Request任何 REST API
Atlas Cloud多模型工作流

根据 n8n 的 OpenAI 节点文档,OpenAI 节点支持图像操作(如生成和编辑图像)以及视频生成操作。该文档同样指出,如果支持的节点没有提供你所需的操作,你可以使用 HTTP Request 节点直接调用该服务的 API。

在实践中,这使得 HTTP Request 节点成为生产级创意自动化最灵活的基础。它可以在同一个工作流中调用图像 API、视频 API、存储 API、审核 API 和 Webhook 回调。

n8n 中的 AI 图像和视频工作流长什么样?

一个可靠的 AI 媒体工作流不仅仅需要一个生成节点。它需要一个小型的流水线来控制输入、请求结构、等待行为、输出处理和失败路径。

一个实用的 n8n 工作流通常包括:

· 用于启动工作流的触发器节点

· 用于设置提示词和配置的 Edit Fields 节点

· 用于调用生成 API 的 HTTP Request 节点

· 用于长时间运行作业的 Wait 节点

· 用于状态检查的 IF 节点或 Switch 节点

· 用于交付内容的 Google Drive、S3、CMS、Slack 或电子邮件节点

· 用于处理失败作业或被拒提示词的错误路径

最常见的错误是将视频生成等同于图像生成。视频请求可能不会立即生成最终文件。具体来说,第一次响应可能仅包含作业 ID、状态值或任务 URL。因此,你的工作流需要等待、检查作业状态,并仅在视频完成时继续执行。

分步指南:构建基础图像生成工作流

从图像生成开始,因为它的环节较少。一旦此工作流调通,视频工作流的理解就会变得容易。

第 1 步:添加触发器

根据提示词的来源选择触发器。定时触发器适用于批量循环内容;Webhook 适用于其他应用提交创意请求时;Google Sheets 或 Airtable 则适用于营销或内容团队维护提示词队列的情况。

例如,一个简单的社交媒体内容工作流可以每天早上运行,读取电子表格中的五行内容,并为每个创意构思生成一张图片。

第 2 步:准备提示词负载

使用 Edit Fields 节点在到达 API 之前规范化提示词。这能保持生成节点的整洁,并使工作流更容易调试。

有用的字段包括:

· prompt (提示词)

· model (模型)

· aspect_ratio (宽高比)

· output_format (输出格式)

· brand_style (品牌风格)

· destination_folder (目标文件夹)

此步骤也是添加可重用提示词结构的地方。例如,将产品描述、营销角度、视觉风格和输出格式组合成一个最终的提示词字段。

第 3 步:调用图像生成 API

如果你的工作流仅需要 OpenAI 支持的图像操作,请使用 OpenAI 节点。如果你需要自定义端点、非 OpenAI 图像模型或统一的 API 提供商,请使用 HTTP Request 节点。

对于 Atlas Cloud 工作流,图像模型可以包括价格为 USD0.009/张的 GPT Image 2,价格为 USD0.028/张的 Qwen Image 2.0,或者价格为 USD0.03/张的 Wan-2.7 Text-to-image

具体的请求体取决于模型端点。在 n8n 中,重要的配置模式是一致的:

  1. 方法:POST
  2. 身份验证:基于 Header 的 API Key 或预定义的凭据(如果可用)
  3. Body:JSON
  4. 响应:JSON 或根据 API 而定的文件/二进制数据
  5. 输出字段:生成的 URL、文件 ID 或二进制数据

第 4 步:保存生成的图像

不要让结果仅仅保留在执行数据中。在发送通知或发布链接之前,将生成的图像保存到持久的存储目的地。

常见目的地包括:

· Google Drive

· Amazon S3

· Dropbox

· CMS 媒体库

· Airtable 附件字段

· Slack 频道

如果 API 返回的是临时图像 URL,请在 URL 过期之前添加第二个 HTTP Request 节点来下载文件,然后将二进制输出上传到你的存储目的地。

分步指南:构建视频生成工作流

视频生成需要稍有不同的架构,因为许多视频模型是作为异步作业运行的。

第 1 步:提交视频作业

使用 HTTP Request 节点发送提示词、模型、持续时间、宽高比,如果是“图生视频”,则还需发送输入图像。

有用的视频请求字段包括:

· prompt

· model

· duration

· aspect_ratio

· mode

· input_image_url

· callback_url

如果提供商支持回调,可以使用类似 Webhook 的恢复流。如果不支持,则使用轮询。

第 2 步:存储作业 ID

提交请求后,将返回的作业 ID 或任务 ID 存储在例如

text
1video_job_id
的字段中。该值是工作流后续检查进度时使用的关键标识。

这对生产工作流来说是一个重要的信息获取点:作业 ID 应该贯穿后续的每一个节点。如果你丢失了它,就无法可靠地将已完成的视频与创建它的原始提示词、营销活动、用户或存储文件夹匹配起来。

第 3 步:检查状态前进行等待

在轮询状态端点之前添加一个 Wait 节点。n8n 的 Wait 节点可以将执行暂停一段时间、暂停到指定时间,或者直到 Webhook 调用恢复工作流。

对于轮询,较短的等待间隔通常足以避免频繁调用 API。对于基于回调的提供商,Wait 节点可以在提供商调用生成的 URL 时恢复,但你也应该设置一个限制,以免失败的作业无限期等待。

第 4 步:轮询直至视频就绪

在 Wait 节点之后,使用另一个 HTTP Request 节点调用提供商的状态端点。然后使用 IF 或 Switch 节点根据状态值进行分支处理。

典型的状态包括:

· queued (队列中)

· processing (处理中)

· succeeded (成功)

· failed (失败)

· expired (已过期)

如果状态仍为 queued 或 processing,则循环回到 Wait。如果状态为 succeeded,则继续执行下载或发布步骤。如果状态为 failed,则将该作业连同原始提示词、作业 ID 和错误消息发送到错误处理路径。

第 5 步:保存或发布最终视频

当视频就绪后,在分享前保存最终文件。这可以防止在提供商 URL 过期或访问令牌轮换时出现链接失效的情况。

对于视频自动化,存储不仅是整理,更是可靠性层的一部分。如果一个工作流生成了视频却未保存最终文件,那么在营销系统中进行审计、重新发布或重复使用将变得非常困难。

如何在 n8n 图像和视频自动化中使用 Atlas Cloud

当你的 n8n 工作流需要不止一个模型系列或不止一种创意模态时,Atlas Cloud 非常有用。你无需为图像生成、图像编辑、文生视频和图生视频分别配置不同的提供商,而是可以通过一个全模态 AI 推理平台来路由工作流。

Atlas Cloud 通过一个统一的 API 生态系统为开发者提供了对 300 多种 SOTA 模型的访问权限。对于 n8n 构建者来说,其核心价值很简单:一个 API Key、一个端点、一个整合的账户,以及跨文本、图像和视频模型的一致集成模式。

对于已经在使用 OpenAI 风格 API 调用的团队,Atlas Cloud 被设计为与 OpenAI 兼容的 API(一种可与熟悉的 OpenAI 风格 SDK 调用配合使用的 API 模式)。在许多情况下,设置仅需几分钟:

  1. 创建 Atlas Cloud 账户。
  2. 生成 API Key。
  3. 更新 base_url。
  4. 在 HTTP Request 或 SDK 配置中替换 API Key。
  5. 在请求负载中选择目标模型。

在 n8n 中,这意味着 HTTP Request 节点可以成为一个可重用的模型网关。一个分支可以调用图像模型,另一个分支可以调用视频模型,第三个分支可以根据营销活动类型、预算或输出格式进行路由。

用于自动化创意工作流的模型选择

合适的模型取决于工作流的产出内容。产品图像流水线不需要与电影级视频工作流相同的模型,而每日社交内容工作流可能更关心单次产出的成本而非极致的视觉保真度。

对于图像生成,当工作流需要通用的提示词遵循能力和精美的视觉输出时,GPT Image 2 是一个强力的默认选择。Qwen Image 2.0 适用于团队希望对比不同模型系列的图像生成和编辑工作流。Wan-2.7 可以适配将图像和视频任务组合在同一个更广泛创意技术栈中的工作流。

对于视频生成,决策通常由持续时间、成本、运动质量以及工作流是基于文本还是输入图像驱动。 Seedance 2.0 Text-to-Video 的价格约为 USD0.096/秒,而 Seedance 2.0 Fast Text-to-Video 约为 USD0.076/秒。Kling v3.0 Std Text-to-Video 价格为 USD0.071/秒,Vidu Q3-Turbo Text-to-video 价格为 USD0.034/秒。

这些数字在 n8n 中至关重要,因为自动化会放大使用量。生成一个测试片段的工作流是创意实验,而每周生成 200 个片段的工作流则是一个成本系统。

故障排查:n8n AI 生成工作流为何失败

大多数失败的 AI 媒体工作流源于请求结构、身份验证、时序或文件处理问题。

如果 API 请求立即失败,请首先检查凭据。Header 名称、Bearer Token 格式以及特定环境的 API Key 都容易配置错误。在 n8n 中,尽可能使用“凭据”功能,而不是直接在节点字段中硬编码 Key。

如果请求成功但未出现资源,请检查响应结构。文件 URL、图像字段或作业 ID 可能嵌套在比预期更深的地方。添加一个临时的 Edit Fields 或 Code 节点来映射你需要的确切字段。

如果视频生成看起来卡住了,请检查工作流是否轮询过快、过早停止,或忽略了中间状态。一个好的轮询循环应该显式处理 queued、processing、success 和 failure 状态。

如果输出文件稍后消失了,可能是因为提供商返回的是临时 URL。请在通知用户或发布链接之前下载结果并将其存储在自己的目的地。

安全性、成本和生产说明

创意自动化可能会很快变得昂贵,尤其是当视频生成是通过表单、电子表格或公共 Webhook 触发时。在将工作流交付给团队使用之前,请添加控制措施。

生产级 n8n 工作流至少应包括:

· 生成前的提示词校验

· 存储在 n8n 凭据中的 API 密钥

· 速率限制或批量限制

· 针对临时故障的重试逻辑

· 视频作业的最大等待时间

· 最终资产的持久存储

· 针对提示词、模型、作业 ID 和输出 URL 的元数据记录

最后一点对于成本核算非常重要。如果你记录了模型和持续时间,就可以估算每次创意运行的成本,并决定何时将较便宜的草稿路由到一个模型,而将最终输出路由到另一个模型。

常见问题解答

n8n 能否同时自动化 AI 图像和视频生成?

可以。n8n 可以通过结合触发器、数据转换节点、API 调用、等待步骤和存储集成来自动化 AI 图像和视频生成。OpenAI 节点支持图像和视频操作,而 HTTP Request 节点可以调用任何提供所需生成功能的 REST API。

我在 n8n 进行视频生成时需要使用 HTTP Request 节点吗?

不一定,但 HTTP Request 节点通常是视频生成最灵活的选择。它允许你提交作业、检查状态端点、下载最终文件并连接到超出 n8n 原生应用节点的提供商。

如何在 n8n 中处理长时间运行的视频生成作业?

使用“提交作业”请求,存储返回的作业 ID,添加一个 Wait 节点,然后轮询状态端点,直到作业成功或失败。如果 API 支持回调,你可以使用 Webhook 恢复模式代替重复轮询。

在 n8n 中,我可以使用同一个 API 提供商来处理图像和视频模型吗?

可以。像 Atlas Cloud 这样的统一 API 平台可以减少对单独图像和视频提供商的需求。当工作流需要图像生成、图像编辑、文生视频、图生视频、模型切换以及在同一个自动化系统中进行合并结算时,这一点非常有用。

Atlas Cloud 是否适合 n8n 创意自动化?

当你的 n8n 工作流需要多个模型或多种模态时,Atlas Cloud 是一个强力的选择。它特别适合那些正在构建创意自动化、社交媒体流水线、产品视觉工作流、营销资产生成或内部内容系统的团队,因为这些系统需要通过一个 API 层来接入文本、图像和视频模型。

总结

要在 n8n 中自动化 AI 图像和视频生成,请从工作流模式入手:触发、输入提示词、调用 API、等待或轮询,然后保存最终资产。保持图像工作流的直接性,将视频工作流视为需要状态跟踪的异步作业。

对于简单的 OpenAI 使用场景,OpenAI 节点或许足够。但对于自定义 API、多模型工作流和生产级创意自动化,HTTP Request 节点能为你提供最大的控制力。

如果你的下一步是构建跨图像和视频模型的可重复 n8n 工作流,Atlas Cloud 为你提供了一个实用的 API 层,能够以更少的提供商碎片化实现目标:一个 API Key、一个端点、一个账户,以及涵盖文本、图像和视频的 300 多种模型。

最新模型

一个 API,畅享全模态 AI。

探索全部模型

Join our Discord community

Join the Discord community for the latest model updates, prompts, and support.

如何在 n8n 中自动生成 AI 图像和视频