摘要:Atlas Cloud 宣布接入 SkyReels-V4,这款在全球榜单稳居前二的大模型支持音画同生。它支持像素级的多模态控制,能像修图一样精准编辑视频内容。通过 Atlas Cloud API 的算力优化,影视与营销团队可以更低成本地获取 1080p 电影级生成能力。
一、 引言
Atlas Cloud 致力于为创作者提供最前沿的生成式 AI 能力。很快,备受瞩目的视频基础模型 SkyReels-V4 将正式接入我们的平台。
由昆仑天工开发的 SkyReels-V4,刚刚在权威第三方机构 Artificial Analysis 的文转视频(含音频)全球榜单中强势登顶第 2 名。它打破了传统的“先生成画面、后配音配乐”的割裂工作流,通过全模态参考和一体化生成,为视频创作带来了前所未有的自由度。

- 核心优势: 为影视后期、营销团队和短剧创作者提供多模态精准控制、高质量音画同步、以及像素级的视频修复与编辑能力。
- 当前状态: 即将发布。
二、 核心特性
相比于目前市面上仅支持纯文本输入的视频模型,SkyReels-V4 实现了三大维度的代际跨越:
-
原生音画联合生成:
-
摒弃了传统的后期拼凑模式,模型可以在内部同步处理视频和音频。无论是人物开口说话的唇形同步、还是脚步声与动作的严丝合缝,都能在微秒级的时间轴上精准对齐。极大缩减了后期团队寻找音效、卡点配乐和对口型的时间成本。

-
全维度的多模态控制与编辑:
-
它不仅听得懂文字,还能“看懂”图片、视频片段甚至遮罩和音频参考。这使得它可以进行极其复杂的局部修改,例如精准替换视频主体、凭空增加配饰,甚至一键消除字幕和水印。视频修改不再需要“全盘推翻重抽”,创作者可以像修图一样精准修改视频,大幅提升商业交付效率。
-
电影级画质与长序列稳定性:
-
通过创新的工程解法,模型能够在降低算力消耗的同时,稳定输出 1080p 分辨率、32帧/秒、长达 15 秒的电影级高清画面。
三、 应用场景
影视与叙事创作
- 场景: 影视后期中的角色替换或风格迁移,需要保持原有镜头的运镜、光影与人物动作不变。
- 提示词: 把参考视频中左侧跳舞的女性替换为参考图1里的狗,并将视频中右侧身穿全套西装跳舞的男性替换为参考图2里的猫,确保动作保持一致。
- 输出效果: 模型不仅完美迁移了猫狗的毛色与体态,生成的动物舞步还能精准踩中原视频的音乐节拍。
![]() | ![]() |
营销与社交媒体运营
- 场景: 针对已有素材进行快速迭代修改,如添加特定的商业产品元素,或进行素材的无痕清理。
- **提示词:**移除视频中最右边那位手持手电筒的浅金色短发年轻男子,以及那位身穿深紫色上衣、留着金色长卷发的女子。
- 输出效果: 实现了自然、无违和感的物品穿戴效果,帽子随着舞者的动作产生极其合理的物理移动,彻底改变了商业素材的二次创作模式。
四、 在 Atlas Cloud 您将获得什么?
- 灵活的工作流整合: 通过 Atlas Cloud,您可以将 SkyReels-V4 强大的视频修复和局部编辑能力无缝接入您的自动化管线中。
- 成本与效率双赢: 我们将对模型的推理算力进行深度优化,让您以更低廉的 API 调用成本,高频次地进行视频修改与试错,彻底释放团队生产力。
敬请期待,即将上线!
第一时间在 Atlas Cloud 注册获取体验资格,重塑您的音视频创作管线。







