Wan 2.6 现已在 Atlas Cloud 上线:长篇、多镜头视频生成新标准

Wan 2.6 现已在 Atlas Cloud 上线:长篇、多镜头视频生成新标准

我们荣幸地推出 Wan 2.6,这是我们视频生成能力的强大升级,现已在 Atlas Cloud 上线。本次发布着重于延长视频时长、通过多镜头一致性增强叙事控制,并为专业创作者提供灵活的分辨率选项。

Wan 2.6 快照:

模型最高分辨率最长时长音频支持价格
Wan 2.6 文本到视频1080P15秒720P: 0.075/秒 & 1080P: 0.1125/秒
Wan 2.6 图像到视频1080P15秒720P: 0.075/秒 & 1080P: 0.1125/秒
Wan 2.6 参考到视频1080P10秒720P: 0.1125/秒 & 1080P: 0.16875/秒

Wan 2.6 介绍

Wan 2.6 为生产工作流程引入了显著的优化。它超越了简单的动画片段,支持更长、叙事更复杂的视频生成。通过集成先进的时间处理能力,它允许用户通过一致的角色和场景讲述完整的故事。

主要功能

15 秒长视频生成

Wan 2.6 显著扩展了生成内容的时序能力。用户现在可以生成长达 15 秒的视频。

  • 重要性: 此前模型通常限制在 5-10 秒。15 秒的能力允许更完整的故事弧线、更丰富的时空内容,并为 YouTube Shorts 或 TikTok 等社交媒体格式提供足够的运行时间,而无需拼接多个片段。

多镜头叙事控制

此功能专为故事讲述者设计。Wan 2.6 可以在单个生成任务中生成模仿专业剪辑的多角度镜头(shots)序列。

  • 工作原理: 模型在不同镜头之间保持关键信息(角色、环境、光照)的高度一致性。
  • 智能故事板: 它支持简单的提示词,模型会将其智能地分解为故事板,确保视觉流程在电影学上具有意义。

视频参考生成(视频到视频)

Wan 2.6 引入了强大的"视频参考"功能。

  • 功能: 您可以输入一个参考视频来指导新生成内容的风格和语调。
  • 灵活性: 它支持使用人物或任何对象作为主要主体。
  • 交互: 该模型支持复杂场景,包括单主体聚焦或双主体交互(例如,联合主演/配对),非常适合使用文本提示词修改内容,同时保留参考视频的氛围来重现热门趋势或特定的运动模式。

Wan 2.6 的应用案例

凭借延长的 15 秒时长和多镜头一致性,Wan 2.6 适用于各种专业应用:

  • 社交媒体内容: 创作者可以为 Reels 或 TikTok 制作即时发布的 15 秒片段。原生音频同步和高帧率(24fps)确保输出的专业性和吸引力。
plaintext
1Prompt:
2A cinematic sci-fi trailer. Shot 1: Wide shot, a lonely explorer in a battered spacesuit walking across a desolate red Martian desert, a massive derelict spaceship in the distance. Shot 2: Close-up, the explorer stops and wipes dust off their helmet visor, eyes widening in shock. Shot 3: Over-the-shoulder shot, revealing a glowing, bioluminescent blue flower blooming rapidly in front of them. 8k resolution, highly detailed, consistent character.

输出

  • 商业广告: 多镜头功能允许营销人员在单次生成视频中从不同角度(特写、广角)展示产品,减少复杂的后期制作编辑需求。
plaintext
1Prompt:
2A fluffy, adorable British Shorthair kitten with huge round eyes, cream color. TikTok viral video, bright commercial lighting, high saturation, energetic, wide-angle lens.
3Shots:The Rhythmic Crash Zooms.The kitten sits on a soft rug looking innocent. The camera performs rapid, rhythmic crash zooms (snap zooms):Sudden Extreme Close-up on the kitten's pink nose (filling the screen).Snap back to Wide Shot. Snap in to close-up of one eye.Snap back out.This mimics a "beat-sync" effect. The kitten looks confused but cute.

输出

  • 音乐与创意可视化: 艺术家可以利用视频参考功能,将舞蹈或表演的"氛围"或动作转移到新的动画角色上,保持与原始参考的节拍和能量一致。
plaintext
1lofimusic.MP3
2Prompt:
3Style: High-quality 2D pixel art, 16-bit retro game aesthetic, side-scrolling animation, neon noir, flat design, black background.
4Subject: A silhouette of a little girl running continuously to the right side of the screen.
5[00s-05s] The Spark: The screen is mostly pitch black. As the girl runs, her footsteps ignite neon geometric grids and pixelated streetlights that instantly fade in behind her. The area in front of her (right side) remains a total dark void.
6[05s-10s] Cyberpunk City: The trail behind her expands into a glowing cyberpunk cityscape. Holographic billboards, skyscrapers, and data streams glitch into existence as she passes. Purple and cyan color palette. The contrast between the lit city behind and the darkness ahead is sharp.
7[10s-15s] Deep Sea Dream: The city morphs seamlessly into a bioluminescent deep sea. The pixel buildings turn into glowing jellyfish and coral reefs. She leaves a trail of bubbles and light. Dreamy, ethereal atmosphere matching the lofi beat.
8
9Negative prompt:
103D render, realistic, photograph, detailed face, sunlight, daytime, messy, blurry, noise, full background ahead, light in front, stopping, turning back, static image, complicated details, vector art, smooth lines.

输出

结论

Wan 2.6 通过专注于时长和叙事一致性,扩展了 Atlas Cloud 上的视频生成能力。此次更新从短片段升级到支持多镜头的 15 秒序列,从而实现更详细的故事讲述。通过简化的文本到视频分辨率结构和引入的视频参考工具,该模型为个人创作者和企业工作流程都提供了实用的解决方案。

👇立即在 Atlas Cloud 上体验 Wan 2.6。👇

Wan 2.6 系列:

Wan 2.6 文本到视频

Wan 2.6 图像到视频

Wan 2.6 视频到视频

常见问题解答

Wan 2.6 中的文本到视频分辨率选择与之前版本有何不同?

在 Wan 2.5 及更早的模型中,用户选择特定的像素尺寸。在 Wan 2.6 中,该过程类似于图像到视频的工作流程。用户选择一个通用的质量层级(720p 或 1080p),系统会自动从支持的列表中应用适当的分辨率(例如,1080p 层级的 1920×1080 或 1440×1440)。

支持的最大视频时长是多少?

Wan 2.6 支持生成长达 15 秒的视频。这适用于文本到视频和图像到视频任务。

Wan 2.6 能处理复杂的人物交互吗?

是的。视频参考功能支持单主体聚焦以及双主体交互(例如,两人联合主演)。模型使用参考视频和提示词来保持主体的外观和交互逻辑。

"多镜头"功能需要复杂的提示词吗?

不。该系统支持简单的提示词。它使用智能故事板将简单的提示词分解为多个镜头,同时确保关键视觉信息在序列中保持一致。

在哪里可以访问 Wan 2.6? Wan 2.6 目前可在 Atlas Cloud 上使用。

相关模型

300+ 模型,即刻开启,

尽在 Atlas Cloud。

探索全部模型