Meet the Happy Horse 1.0 API & Happy Horse 1.1 API

HappyHorse API on Atlas Cloud 連接您的應用程式至阿里巴巴的 HappyHorse 1.0 和 1.1 影片生成模型。製作長度 3 到 15 秒的影片片段，支援 720p 或 1080p 解析度，可透過最多九張參考圖片調整結果，並選擇適合您產品的寬高比。Atlas Cloud 提供 Day-0 模型可用性、可靠的服務可用性和簡單的非同步 REST 整合。立即開始構建。

探索領先模型

Atlas Cloud 為您提供最新的行業領先創意模型。

NEW

參考生影片

HappyHorse-1.1 Reference-to-video

Generates videos from one to nine reference images and a text prompt, supporting 720P or 1080P output, flexible aspect ratios, and durations from 3 to 15 seconds.

HappyHorse-1.1 Image-to-video

Animates a first-frame image into video with optional prompt guidance, 720P or 1080P output, and durations from 3 to 15 seconds.

HappyHorse-1.1 Text-to-video

Generates videos from text prompts with HappyHorse 1.1, supporting 720P or 1080P output, flexible aspect ratios, and durations from 3 to 15 seconds.

HappyHorse-1.0 Text-to-video

Generates videos from text prompts with HappyHorse 1.0, supporting 720P or 1080P output, flexible aspect ratios, and durations from 3 to 15 seconds.

HappyHorse-1.0 Image-to-video

Animates a first-frame image into video with optional prompt guidance, 720P or 1080P output, and durations from 3 to 15 seconds.

HappyHorse-1.0 Reference-to-video

Generates videos from one to nine reference images and a text prompt, supporting 720P or 1080P output, flexible aspect ratios, and durations from 3 to 15 seconds.

HappyHorse-1.0 Video-edit

Edits an input video with text instructions and optional reference images, supporting 720P or 1080P output.

From

$0.14/秒

峰值速度

最低成本

模態	描述
HappyHorse-1.1 Text-to-Video API	一次性透過文字提示詞生成帶有同步音訊的 1080p 影片。1.1 版本帶來了提升的運動表現力、更強的提示詞遵循度，以及針對複雜多鏡頭敘事的更智慧的場景規劃。
HappyHorse-1.1 Image-to-Video API	將靜態圖像轉換為流暢的影片，同時保持主體特徵和視覺一致性。1.1 版本在動態構圖中提供了更符合物理規律的運動以及更好的影格間連續性。
HappyHorse-1.1 Reference-to-Video API	透過使用多張參考圖片引導影片生成，實現對風格、角色一致性和品牌元素的精準控制。1.1 版本升級的多參考融合技術可在整個影片片段中保持產品細節和視覺保真度的穩定。
HappyHorse-1.0 T2V API (Text To Video)	Transforms detailed text prompts into cinematic video sequences with claimed synchronized audio generation. Leverages unified Transformer architecture for joint video-audio synthesis.
HappyHorse-1.0 I2V API (Image To Video)	Animates static images with fluid motion while maintaining visual consistency. Processes reference image latents jointly with text and audio tokens in unified sequence.
HappyHorse-1.0 T2V+Audio API (Text to Video with Audio)	Generates complete audio-visual content from text alone — dialogue, environmental sounds, and Foley effects through unified token denoising.
HappyHorse-1.0 I2V+Audio API (Image to Video with Audio)	Transforms still images into animated scenes with synchronized soundscapes — cinematic audio accompaniment generated in single forward pass.

認識 HappyHorse API：統一影片與音頻單次傳遞

從 Arena 頂級的電影級品質到原生多語言音頻，HappyHorse API 在單一隨用隨付端點之下結合了統一多模態生成、逼真動作、圖像動畫與非同步工作流程。

HappyHorse API 的電影級品質

HappyHorse 在 Artificial Analysis Video Arena 中於 text-to-video 和 image-to-video 兩項排名第一，經由盲目人類偏好評判。這一排名體現在具有說服力的細節、光線和電影構圖的影像素材上。

跨七種語言的唇形同步

原生唇形同步支援普通話、粵語、英語、日語、韓語、德語和法語，對話和 Foley 與影片一併生成。本地化活動不再需要單獨的配音或音效設計流程。

HappyHorse API 的統一多模態核心

文本、圖像、影片和音頻令牌通過單一統一的 Transformer 序列流動，而非串聯的多階段管道。您的整合保持簡單，因為每種生成模式都共享同一底層架構。

遵循實世物理的動作

當對象奔跑、碰撞或相互作用時，物理保持可信，這正是 HappyHorse 在 Video Arena 的盲目 image-to-video 對比中領先的優勢所在。體育片段、追逐場景和舞蹈序列在螢幕上保持其重量感。

使用 HappyHorse API 將靜照轉化為生動場景

將一張照片輸入 image-to-video 端點，觀看它轉變為流暢的 1080p 動作，同時保持主體身份不變。產品照片、肖像和概念藝術都能動畫化而不失原有外觀。

快速周轉，非同步設計

非同步任務工作流保持生成進行中：提交提示、輪詢狀態並檢索完成的剪輯，無需阻塞您的應用程式。快速迭代週期適配緊湊的活動和原型設計期限。

HappyHorse vs 其他模型 - 單一提示詞

同一個提示詞，由 HappyHorse 和其他領先的視訊模型生成：電影短片和高端商業影片

提示詞

創作一部10秒的電影短片，講述街頭音樂家與小孩在陽光灑滿的城市廣場相遇的故事。第1幕，0-2秒：寬景建立鏡頭展示下午晚時分明亮的歐洲風格城市廣場。街頭音樂家坐在噴泉旁彈著原聲吉他。溫暖的陽光、柔和的陰影、背景中移動的鴿群、自然的城市氛圍。第2幕，2-5秒：中景追蹤鏡頭，一名小孩手持紅氣球走向音樂家。音樂家繼續彈吉他。小孩的腳步聲、吉他節奏與環境人群聲應該感覺同步且自然。第3幕，5-8秒：近景雙人鏡頭：音樂家微笑著略微改變旋律，小孩停在他身邊輕輕按著氣球隨音樂搖擺。保持兩個角色的臉部、衣著、身體比例與空間位置的一致。第4幕，8-10秒：最終電影拉遠鏡頭：音樂家繼續演奏，小孩開心笑著，鴿群飛過廣場，噴泉在陽光下閃爍。音樂與城市氛圍自然淡出。要求： - 保持所有鏡頭中兩個角色身份、服裝與身體比例的一致性 - 保持紅氣球、吉他、噴泉與城市廣場佈局的一致性 - 使用清晰的電影鏡頭語言：廣角鏡頭、追蹤鏡頭、近景雙人鏡頭、拉遠鏡頭 - 音頻與視覺同步：原聲吉他、腳步聲、小孩笑聲、鴿群、噴泉、城市氛圍 - 自然的人體動作、穩定的手部、逼真的吉他演奏姿態 - 無扭曲面部、無服裝變化、無氣球或吉他消失 - 溫暖的電影感、精緻的短片質感、1080p

HappyHorse 1.1

Kling V3.0

Pixverse V6

提示詞

為智能咖啡機創作一部10秒的電影生活風格商業廣告。第1幕，0-2秒：早晨明亮現代廚房的廣角鏡頭。智能咖啡機放在乾淨的檯面上，旁邊擺著白色陶瓷杯。柔和陽光透過窗戶灑入，溫暖而自然。第2幕，2-5秒：年輕專業人士進入廚房並點擊咖啡機觸控屏的中景鏡頭。屏幕平滑亮起。配上輕柔的按鈕聲、安靜的機器啟動聲與微妙的早晨氛圍。第3幕，5-8秒：咖啡倒入杯子的特寫鏡頭。蒸汽自然升起，表面形成油脂層，機器保持完全相同的設計、尺寸、顏色、觸控屏位置與材質。倒水聲應與液體流動相符。第4幕，8-10秒：最終英雄鏡頭：人物舉起咖啡杯微笑，咖啡機在背景中清晰可見。攝影機緩慢拉遠，展現乾淨高端的家電商業廣告質感。要求： - 在所有鏡頭中保持咖啡機設計完全一致 - 保持廚房佈局、檯面、杯子、光線與產品尺度的一致性 - 使用清晰的電影鏡頭語言：廣角鏡頭、中景互動鏡頭、特寫、拉遠鏡頭 - 音頻與視覺同步：按鈕點擊聲、機器啟動聲、咖啡倒出聲、早晨柔和氛圍 - 自然的手部動作、逼真的液體物理效果、穩定的產品形狀 - 無扭曲手部、無觸控屏位置改變、無產品細節不一致 - 明亮的電影感、高端生活風格廣告質感、1080p

HappyHorse 1.1

Kling V3.0

Pixverse V6

HappyHorse API 的應用舞台

從原生音訊社群短片到多語言行銷活動、參考引導角色和文本驅動編輯，HappyHorse API 將所有生成模式統一整合到一個按需付費的 Atlas Cloud 端點。

使用 HappyHorse API 製作短形式社群短片

對白、環境音和擬音效果與 3 至 15 秒短片一次性生成。創作者可為 TikTok、Reels 和 Shorts 製作豎版內容，無需另外的配音流程。

動起來的產品照片才好賣

如果只有產品照片，圖片轉影片動畫可添加逼真的動作效果，同時保留原始幀。線上賣家可將靜態商品目錄轉換成展示片段，直接用於商品列表和廣告。

透過 HappyHorse API 進行多語言行銷活動

原生口型同步涵蓋七種語言，從國語和英文到日文、韓文、德文和法文。全球行銷團隊可將單一行銷活動轉換為各市場的在地化廣告，無需聘請配音員。

角色始終保持一致

最多九張參考圖片引導影片生成，確保角色身份、風格和品牌元素保持一致。連續劇製作者和虛擬網紅工作室可在各場景之間保持角色面部的一致性。

用純文本編輯影片素材

用純文本描述變更，影片編輯端點直接將其應用到現有素材。後期製作團隊可重新設定場景風格、替換元素和修復鏡頭，無需重新安排拍攝。

透過 HappyHorse API 預視場景

需要在拍攝前預視場景？Arena 領先的 1080p 視覺品質將劇本轉換為預視影片，電影團隊和代理機構可用來協調構圖和節奏。

模型	輸入類型	輸出時長	解析度	音頻生成
HappyHorse-1.0	文本、圖像	5–8s	1024×1024	√
Seedance 2.0	文本、圖像	4~15s	1024×1024	√
Kling 3.0	文本、圖像	3~15s	256P~4K	√
Wan-2.6	文本、圖像	5s、10s、15s	1080P、720P	√

如何在 Atlas Cloud 上使用 Happy Horse

幾分鐘即可上手 — 按照以下簡單步驟，透過 Atlas Cloud 平台整合和部署模型。

建立 Atlas Cloud 帳戶

在 atlascloud.ai 註冊並完成驗證。新用戶可獲得免費額度，用於探索平台和測試模型。

為何在 Atlas Cloud 使用 Happy Horse

將先進的 Happy Horse 模型與 Atlas Cloud 的 GPU 加速平台相結合，提供無與倫比的效能、可擴展性和開發體驗。

效能與靈活性

低延遲：
GPU 最佳化推理，實現即時回應。

統一 API：
一次整合，暢用 Happy Horse、GPT、Gemini 和 DeepSeek。

透明定價：
按 Token 計費，支援 Serverless 模式。

企業與規模

開發者體驗：
SDK、資料分析、微調工具和模板一應俱全。

可靠性：
99.99% 可用性、RBAC 權限控制、合規日誌。

安全與合規：
SOC 2 Type II 認證、HIPAA 合規、美國資料主權。

HappyHorse API 常見問題集

HappyHorse API 為開發者提供對 HappyHorse 的程式化存取——HappyHorse 是 Alibaba 的影片生成模型家族，在 Artificial Analysis Video Arena 的 text-to-video 和 image-to-video 類別中都排名第一。基於統一多模態 Transformer 架構，它可在單次生成中產出高達 1080p 的影片，並配有同步音訊。Atlas Cloud 透過單一 OpenAI 兼容的 API 金鑰提供 HappyHorse 1.0 和 1.1，採用按使用量計費的定價。

兩個版本共享相同的架構和相同的 text-to-video、image-to-video 及 reference-to-video 端點。HappyHorse 1.1 改進了動作表現力、提示詞準確度和多參考融合，使複雜的多場景敍述和品牌一致的片段更加穩定。HappyHorse 1.0 額外提供了 video-edit 端點，可透過文字指令轉換現有素材。

建立 Atlas Cloud 帳戶、從儀表板產生 API 金鑰，然後向任何 HappyHorse 端點發送請求。生成以非同步方式進行：提交提示詞、接收工作 ID，然後輪詢狀態端點直到影片準備就緒。由於計費採按使用量計費，無需設定訂閱。立即開始構建。

text-to-video、image-to-video 和 reference-to-video 在 HappyHorse 1.0 和 1.1 上都可用，而 1.0 額外提供了 video-edit 模式以重新加工現有素材。每種模式接受最多 2500 個字元的提示詞，並透過相同的任務式工作流返回影片，因此在模式之間切換只需改變請求中的模型路徑。

輸出可渲染為 720P 或 1080P，片段長度可調整為 3 到 15 秒。支援 9 種寬高比，包括 16:9、9:16、1:1、4:3、3:4、4:5、5:4、21:9 和 9:21，涵蓋從垂直社交片段到超寬電影畫幅的所有應用。seed 參數也讓你能夠重現你喜歡的生成結果。

需要在片段中保持角色或品牌元素的一致性？reference-to-video 接受一到九張參考圖片以及文字提示詞，並在整個影片中保持身份、產品細節和風格穩定。每個圖片可以是 JPEG、JPG、PNG 或 WEBP 格式，大小最多 20MB，短邊至少 400 像素。

是的。HappyHorse 在單次前向傳遞中與影片一起產生對白、環境音和音效，而無需依賴獨立的音訊管道。原生唇音同步支援七種語言：普通話、粵語、英語、日語、韓語、德語和法語，使其適用於多語言活動，無需額外配音工作。

Atlas Cloud 上每個 HappyHorse API 端點定價為每次生成 $0.14，按使用量計費，無訂閱或最低承諾。無論你在 1.0 上呼叫 text-to-video 還是在 1.1 上呼叫 reference-to-video，每次呼叫的價格保持相同，因此隨著使用量增加，成本保持可預測。立即開始。

HappyHorse 1.0 在 2026 年 4 月進入 Artificial Analysis Video Arena 時，基於盲人偏好投票，立即在 text-to-video 和 image-to-video 兩個類別中排名第一。在不含音訊的 image-to-video 中，它達到了 1402 的 Elo 分數，領先 Seedance 2.0 的 1355 和 Grok Imagine Video 的 1331。隨著新模型推出，Arena 排名會發生變化，請檢查即時排行榜以了解目前的排名。

探索更多系列

Seedance 2.0

Seedance 2.0 API 為您提供 ByteDance 多模態影片模型的生產級存取權限——支援四模態輸入（文字、影像、影片、音訊），以及業界領先的「Universal Reference」（通用參考）系統，可在不同鏡頭間鎖定構圖、運鏡與角色動作。只需一次 API 呼叫即可整合導演級控制，固定費率為 $0.09/秒，即時取得金鑰，無需排隊——由企業級正常運行時間與合規性提供保障。Seedance 2.0 原生 4K 現已上線！

檢視系列

Grok Imagine

Grok Imagine API 為開發者提供 xAI 的圖像、影片和音訊生成一站式套件。它可以生成解析度高達 2K 且支援多語言文本渲染的圖像，以及長達 15 秒且帶有原生同步音訊和基於參考圖像編輯功能的影片。在 Atlas Cloud 上，只需一個金鑰即可執行每個 Grok Imagine 模式，因此您可以在圖像、影片和音訊之間無縫切換，無需單獨設定，每張圖像 0.02 美元起，每秒 0.05 美元起。

檢視系列

Gemini Omni Flash

Gemini Omni API 將 Google DeepMind 於 Google I/O 2026 發表的多模態影片生成與編輯模型帶進你的技術棧。Gemini Omni 將 Gemini 的推理引擎與生成式媒體融合，可接受文字、圖片、影片與音訊的任意組合輸入，產生一致且以知識為根據的輸出。透過自然對話持續打磨成果：替換物件、改寫場景、切換風格，同時維持物理規律、角色與畫面連貫性不變。Atlas Cloud 透過單一整合 API 提供完整的 Gemini Omni Flash 系列——文字生成影片、支援最多 7 張參考圖片的圖片生成影片，以及參考圖生成影片——採每秒計費、價格透明，$0.112 起，無需訂閱。立即開始打造。

檢視系列

GPT Image 2

GPT Image 2 API 為開發者提供了訪問 OpenAI 最新圖像模型的途徑，它是 GPT Image 1.5 的繼任者。該模型可生成和編輯圖像，能夠在拉丁和 CJK 文字上實現準確的文本渲染，並在海報、樣機和資訊圖表方面具備強大的排版能力。在 Atlas Cloud 上，您可以透過一個統一的 API 與 300 多個模型一起訪問它，並享受免費額度、99.99% 的正常運行時間，且無需 OpenAI 組織驗證。

檢視系列

Google

Google最強大的創意模型現已在Atlas Cloud上全面可用。Veo 3.1提供電影等級的影片生成，Nano Banana 2支援高保真圖像建立，而Gemini為每個工作流程帶來多模態智慧。透過單一API key即可存取完整的Google模型套件，提供Day-0可用性和隨用隨付（pay-as-you-go）定價。

檢視系列

Seedance 2.0 Mini

Seedance 2.0 Mini 將 ByteDance 的多模態影片生成技術引入到對速度和成本要求極高的工作流程中。它以更輕量的佔用空間提供 Seedance 2.0 的核心能力——更快的生成速度、更低的單支影片成本，並且使用您現有的同款 API 整合。對於運行高吞吐量流水線或進行大規模原型設計的團隊來說，Mini 是最實用的預設選擇。

檢視系列

ByteDance

從電影級影片生成到高保真影像建立，ByteDance 最強大的模型現已在 Atlas Cloud 上線。以最低的推論定價和零基礎設施開銷，大規模執行 Seedance 和 Seedream。

檢視系列

Alibaba

Atlas Cloud 將 Alibaba 的全系模型陣容整合至同一個 API 中：Qwen 適用於語言和圖像任務，Wan 適用於高達 1080p 的影片生成。所有模型均採用按需付費模式，無需訂閱。您可以使用現有的 OpenAI 兼容客戶端，透過單一的 base URL 存取 Alibaba API。

檢視系列

OpenAI

Atlas Cloud 為您提供存取完整 OpenAI API 產品線的權限，從用於圖像生成的 GPT Image 2 到用於影片的 Sora 2。每個模型均採用按需付費模式，無月度消費限制。使用相容 OpenAI 的 API，只需簡單替換基礎 URL 即可輕鬆接入。

檢視系列

xAI

在 Atlas Cloud 上使用 xAI API 建構完整的影像與影片處理管線。以 2K 解析度生成、使用參考影像進行編輯，並將影像動畫化為音訊同步的影片片段。

檢視系列

Kwaivgi

Kwaivgi API 價格低於標準定價 15%。Atlas Cloud 提供對最新 Kling 版本的零日（Day-0）存取權限，採用按需付費定價且無席位限制。一個帳戶，一個金鑰，暢享從標準版到大師版的所有 Kling 模型。

檢視系列

Seedream 5.0 Pro

Seedream 5.0 Pro API 為開發者在 Atlas Cloud 上提供了字節跳動的可控圖像編輯模型。它透過錨點和座標精確定位編輯，將圖像分離為可編輯圖層，融合多個參考，並精準匹配顏色和材質，支援 2K 和 3K 解析度的多語言文本。在 Atlas Cloud 上，您只需一個金鑰即可存取！

檢視系列

一個 API，暢享全模態 AI。

探索全部模型

Meet the Happy Horse 1.0 API & Happy Horse 1.1 API

探索領先模型

HappyHorse-1.1 Reference-to-video

HappyHorse-1.1 Image-to-video

HappyHorse-1.1 Text-to-video

HappyHorse-1.0 Text-to-video

HappyHorse-1.0 Image-to-video

HappyHorse-1.0 Reference-to-video

HappyHorse-1.0 Video-edit

峰值速度

認識 HappyHorse API：統一影片與音頻單次傳遞

HappyHorse API 的電影級品質

跨七種語言的唇形同步

HappyHorse API 的統一多模態核心

遵循實世物理的動作

使用 HappyHorse API 將靜照轉化為生動場景

快速周轉，非同步設計

HappyHorse vs 其他模型 - 單一提示詞

HappyHorse API 的應用舞台

使用 HappyHorse API 製作短形式社群短片

動起來的產品照片才好賣

透過 HappyHorse API 進行多語言行銷活動

角色始終保持一致

用純文本編輯影片素材

透過 HappyHorse API 預視場景

如何在 Atlas Cloud 上使用 Happy Horse

建立 Atlas Cloud 帳戶

為何在 Atlas Cloud 使用 Happy Horse

效能與靈活性

企業與規模

HappyHorse API 常見問題集

探索更多系列

Seedance 2.0

Grok Imagine

Gemini Omni Flash

GPT Image 2

Google

Seedance 2.0 Mini

ByteDance

Alibaba

OpenAI

xAI

Kwaivgi

Seedream 5.0 Pro

一個 API，暢享全模態 AI。

Join our Discord community