ShengShu Models on AtlasCloud | Vidu

สร้างไปป์ไลน์การผลิตวิดีโอบน Shengshu API: Vidu Q3 สร้างคลิปวิดีโอระดับภาพยนตร์ความยาว 16 วินาที พร้อมเสียงเนทีฟและการตัดภาพกล้องอัจฉริยะจากการเรียกใช้เพียงครั้งเดียว

AI Video Models by ShengShu

สร้างวิดีโอระดับภาพยนตร์ความคมชัดสูงจากข้อความและรูปภาพ ด้วยโมเดล AI สร้างวิดีโอล่าสุดบน Atlas Cloud

Vidu

Vidu API ให้นักพัฒนาเข้าถึงแบบจำลองวิดีโอจาก Shengshu AI และ Tsinghua University ที่สร้างบนสถาปัตยกรรม U-ViT ซึ่งรวม Diffusion และการออกแบบ Transformer เข้าด้วยกัน ให้ภาพอ้างอิง 1-4 ภาพ และ Vidu จะรักษาความสอดคล้องของวัตถุประสงค์ในทั่วทั้งภาพยนตร์ด้วยการเปลี่ยนกล้องอัจฉริยะและการเคลื่อนไหวที่เรียบและมีลักษณะภาพยนตร์ Atlas Cloud เพิ่มการเข้าถึงแบบจำลอง Day-0 และคีย์ที่เข้ากันได้กับ OpenAI หนึ่งคีย์สำหรับผลิตภัณฑ์ทั้งหมด เริ่มสร้างวันนี้

25 โมเดลสำรวจ Vidu

ShengShu Models API Pricing Details

Compare standard vs. our pricing across every ShengShu model.

Model	Standard Price (USD)	Our Price (USD)	Discount
Vidu Q3-Mix Reference to Video	$0.125	Start from$0.106/s video	-15%	View
Vidu Q3 Reference to Video	$0.05	Start from$0.042/s video	-15%	View
Vidu Q3-Pro Start-end-to-video	$0.05	Start from$0.042/s video	-15%	View
Vidu Q3-Turbo Image-to-video	$0.04	Start from$0.034/s video	-15%	View
Vidu Q3-Turbo Start-end-to-video	$0.04	Start from$0.034/s video	-15%	View
Vidu Q3-Turbo Text-to-video	$0.04	Start from$0.034/s video	-15%	View

Explore models from other providers

Instantly explore and experiment with 400+ production-ready models in the Atlas Playground. Start customizing with one click.

xAI

กรณีการใช้งาน ShengShu API ที่คุณสามารถสร้างได้บน Atlas Cloud

คลิปวิดีโอความยาว 16 วินาที เสียงแบบเนทีฟ และความสอดคล้องของการอ้างอิงหลายรายการของ Vidu Q3 ทำให้สามารถใช้งานได้จริงสำหรับเวิร์กโฟลว์ที่ก่อนหน้านี้ต้องใช้ทีมผลิต ทีมงานใช้ระดับต่างๆ ของ Q3 เพื่อเปลี่ยนจากการทำซ้ำอย่างรวดเร็วไปสู่ชิ้นงานสำเร็จรูปโดยไม่ต้องเปลี่ยนผู้ให้บริการ

ซีรีส์แอนิเมชันที่มีตัวละครสอดคล้องกัน

สตูดิโอและผู้สร้างอิสระใช้ Vidu Q3-Mix เพื่อสร้างเนื้อหาแอนิเมชันแบบหลายตอน โดยที่ตัวละครจะดูเหมือนกันทุกฉาก ด้วยการอัปโหลดแผ่นอ้างอิงตัวละคร คลิปใหม่แต่ละคลิปจะสืบทอดลักษณะใบหน้า เครื่องแต่งกาย และสไตล์ภาพเดียวกัน โดยไม่ต้องทำงานประสานความสอดคล้องแบบเฟรมต่อเฟรมด้วยตนเอง Shengshu ได้สาธิตขั้นตอนการทำงานนี้ที่งาน SXSW 2026 ในฐานะโซลูชัน AI ตัวแรกสำหรับการผลิตซีรีส์แอนิเมชัน

เนื้อหาอวตารแบรนด์และมาสคอตในระดับสเกล

ทีมการตลาดอัปโหลดภาพอ้างอิงของตัวละครแบรนด์เพียงครั้งเดียวและใช้ Vidu Q3 Reference-to-Video เพื่อสร้างคลิปวิดีโอสั้นหลายสิบรายการสำหรับ TikTok, Reels และ YouTube Shorts ตัวละครจะมีภาพลักษณ์ที่เหมือนกันในทุกผลลัพธ์ ช่วยขจัดคอขวดด้านการออกแบบที่ต้องสั่งงานและอนุมัติแต่ละเนื้อหาแยกกัน ด้วยราคา 0.042 ดอลลาร์ต่อวินาทีบน Atlas Cloud คลิปความยาว 10 วินาทีแบบเต็มชุดจะมีราคาต่ำกว่าหนึ่งดอลลาร์ต่อคลิป

วิดีโอการตลาดผลิตภัณฑ์แบบหลายมุมมอง

ทีมงานอีคอมเมิร์ซให้รูปภาพผลิตภัณฑ์จากหลายมุมมองเพื่อใช้เป็นข้อมูลอ้างอิง และสร้างคลิปวิดีโอการตลาดระดับภาพยนตร์ที่แสดงการเคลื่อนไหวของผลิตภัณฑ์พร้อมเสียงสภาพแวดล้อมดั้งเดิม ผลลัพธ์ที่ได้จะมาพร้อมกับเสียงที่ซิงโครไนซ์ในการเรียกใช้งานเดียวกัน พร้อมใช้งานสำหรับโฆษณาและหน้าผลิตภัณฑ์โดยไม่ต้องถ่ายวิดีโอหรือตัดต่อเสียงเพิ่มเติม การควบคุมเฟรมเริ่มต้นและสิ้นสุดช่วยให้ทีมงานสามารถกำหนดทิศทางได้อย่างแม่นยำว่าผลิตภัณฑ์จะถูกเปิดเผยออกมาอย่างไรในแต่ละคลิป

การสร้างฉากแบบกำหนดทิศทางสำหรับพรีโปรดักชันภาพยนตร์

ผู้กำกับใช้การควบคุมกล้องของ Vidu Q3-Pro เพื่อสร้างคลิปภาพตัวอย่างล่วงหน้าพร้อมการเคลื่อนไหวที่ระบุ เช่น การซูมเข้าหาวัตถุ การแพนกล้องข้ามฉาก การถ่ายภาพแบบติดตามตัวละคร การส่งออกดั้งเดิมที่ความยาว 16 วินาทีหมายความว่าฉากสั้นๆ ที่สมบูรณ์สามารถสร้างภาพตัวอย่างล่วงหน้าได้ในการเรียกใช้งานเพียงครั้งเดียว สิ่งนี้เข้ามาแทนที่การทำสตอรี่บอร์ดในระยะเริ่มต้นด้วยข้อมูลอ้างอิงที่มีการเคลื่อนไหวแม่นยำสำหรับนักแสดงและทีมงาน

ไปป์ไลน์เนื้อหาโซเชียลปริมาณมาก

ทีมพัฒนาใช้ Vidu Q3-Turbo เพื่อรันไปป์ไลน์การสร้างแบบกลุ่มในราคา $0.034 ต่อวินาที โดยผลิตคลิปสั้นหลายสิบรายการจากการป้อนข้อความหรือรูปภาพต่อชั่วโมง ต้นทุนต่อวินาทีที่ต่ำกว่าทำให้ใช้งานได้จริงในการสร้างและทดสอบตัวเลือกเชิงสร้างสรรค์มากมายก่อนที่จะเลือกว่าจะขยายขนาดตัวใดด้วย Q3-Pro ทั้งสองโมเดลทำงานภายใต้คีย์ API ของ Atlas Cloud เดียวกันโดยมีการเปลี่ยนพารามิเตอร์เพียงตัวเดียวระหว่างระดับ

การท่องเที่ยวเชิงวัฒนธรรมและเนื้อหาจุดหมายปลายทาง

คณะกรรมการการท่องเที่ยวและแพลตฟอร์มการท่องเที่ยวใช้การแปลงข้อความเป็นวิดีโอ Vidu Q3-Pro เพื่อสร้างคลิปสถานที่ท่องเที่ยวที่ได้บรรยากาศพร้อมเสียงสภาพแวดล้อมที่เป็นธรรมชาติจากพรอมต์ข้อความที่อธิบายรายละเอียด คำอธิบายฉากที่เป็นลายลักษณ์อักษรของทิวทัศน์ สถานที่สำคัญ หรือสภาพแวดล้อมทางวัฒนธรรมจะสร้างคลิปวิดีโอระดับภาพยนตร์ความยาว 16 วินาทีพร้อมเสียงที่เข้ากันได้ในคำสั่งเรียกใช้งานเพียงครั้งเดียว สิ่งนี้เป็นทางเลือกที่คุ้มค่าแทนการถ่ายทำในสถานที่จริงสำหรับเนื้อหาที่ช่วยกระตุ้นความตั้งใจในการจอง

เปลี่ยนวิสัยทัศน์ระดับองค์กรของคุณให้เป็นจริงด้วย Atlas Cloud AI

ติดต่อฝ่ายขาย

คำถามที่พบบ่อยเกี่ยวกับโมเดล ShengShu

Vidu Q3 สามารถสร้างวิดีโอต่อเนื่องได้ยาวนานสูงสุด 16 วินาทีในการเรียก API เพียงครั้งเดียวที่ความละเอียด 1080p และ 24fps นี่คือกรอบเวลาการสร้างวิดีโอแบบขั้นตอนเดียว (single-pass) ที่ยาวนานที่สุดในบรรดาโมเดลวิดีโอชั้นนำในระดับเดียวกัน โดยสามารถกำหนดค่าระยะเวลาของคลิปได้ในการเรียกแต่ละครั้งภายใต้ขีดจำกัดสูงสุดดังกล่าว

ใช่ Vidu Q3 สามารถสร้างบทสนทนา เอฟเฟกต์เสียง ดนตรีประกอบ และการซิงค์ริมฝีปากไปพร้อมกับเฟรมวิดีโอได้ในขั้นตอนการอนุมานเพียงครั้งเดียว ไม่มีการพากย์เสียงในขั้นตอนหลังการถ่ายทำหรือขั้นตอนการจัดตำแหน่งเสียงด้วยตนเอง จังหวะเวลาของเสียงและการเคลื่อนไหวบนหน้าจอจะซิงค์กันโดยอัตโนมัติ

คุณสามารถอธิบายการเคลื่อนไหวของกล้องได้โดยตรงในพรอมต์ข้อความ — ไม่ว่าจะเป็นการซูมเข้า (push-ins), การแพนกล้อง (pans), การถ่ายแบบติดตาม (tracking shots) — และโมเดลจะดำเนินการตามนั้นตั้งแต่เฟรมแรก โดยไม่จำเป็นต้องใช้พารามิเตอร์หรือเลเยอร์ควบคุมแยกต่างหาก ซึ่งครอบคลุมทั้งเอนด์พอยต์ text-to-video และ image-to-video บน Atlas Cloud

Vidu Q3-Pro มอบผลลัพธ์ระดับภาพยนตร์ที่มีการเคลื่อนไหวที่ลื่นไหลและรายละเอียดที่สมบูรณ์ ในราคา 0.042 ดอลลาร์ต่อวินาทีบน Atlas Cloud Vidu Q3-Turbo สร้างด้วยความเร็วที่สูงกว่าพร้อมต้นทุนต่อวินาทีที่ต่ำกว่าที่ 0.034 ดอลลาร์ เหมาะสำหรับฉบับร่างและการทำซ้ำอย่างรวดเร็ว ทั้งสองรุ่นมีความละเอียดเอาต์พุต 1080p เท่ากันและรองรับระบบเสียงแบบเนทีฟ

เอนด์พอยต์ Reference-to-Video ของ Vidu Q3 รองรับรูปภาพอ้างอิงตั้งแต่ 1 ถึง 4 รูปต่อการเรียกใช้งาน คุณสามารถรวมตัวแบบ สภาพแวดล้อม เครื่องแต่งกาย และสไตล์ภาพจากรูปภาพต่างๆ เข้าด้วยกันในการสร้างเพียงครั้งเดียว นี่เป็นวิธีหลักในการรักษาความสอดคล้องของตัวละครและฉากในหลายๆ คลิป

Vidu Q3-Mix เป็นโมเดลอ้างอิงระดับสูงสุดในกลุ่มผลิตภัณฑ์ Vidu Q3 โดยมีราคาอยู่ที่ 0.106 ดอลลาร์สหรัฐฯ ต่อวินาทีบน Atlas Cloud โมเดลนี้มอบความสอดคล้องของหลายวัตถุที่แข็งแกร่งที่สุดเมื่อรวมภาพอ้างอิงหลายภาพในการสร้างเพียงครั้งเดียว ออกแบบมาสำหรับเวิร์กโฟลว์ เช่น การผลิตซีรีส์แอนิเมชันและเนื้อหาของแบรนด์ ซึ่งเอกลักษณ์ของตัวละครจะต้องเหมือนกันทุกประการทางสายตาในหลายๆ คลิป

ใช่ ทั้ง Vidu Q3-Pro และ Q3-Turbo มีปลายทาง Start-end-to-video บน Atlas Cloud คุณเพียงแค่จัดเตรียมรูปภาพเฟรมเริ่มต้นและอธิบายการเคลื่อนไหวหรือสถานะสิ้นสุดที่ต้องการ จากนั้นโมเดลจะสร้างการเปลี่ยนผ่าน สิ่งนี้ช่วยให้สามารถควบคุมการกำกับได้อย่างแม่นยำว่าแต่ละฉากจะเปิดและปิดอย่างไร

Vidu Q3-Turbo เริ่มต้นที่ 0.034 ดอลลาร์ต่อวินาที Vidu Q3-Pro และเอนด์พอยต์ Reference-to-Video อยู่ที่ 0.042 ดอลลาร์ต่อวินาที Vidu Q3-Mix ซึ่งเป็นโมเดลอ้างอิงที่มีความสอดคล้องสูงสุด อยู่ที่ 0.106 ดอลลาร์ต่อวินาที ทุกระดับมีราคาต่ำกว่าอัตรามาตรฐานของ Shengshu API ถึง 15% และให้บริการแบบจ่ายตามการใช้งานจริง (pay-as-you-go)

สำรวจกลุ่มเพิ่มเติม

Seedance 2.0

Seedance 2.0 API ให้คุณเข้าถึงระดับโปรดักชันของโมเดลวิดีโอแบบมัลติโมดัลจาก ByteDance — รองรับอินพุต 4 รูปแบบ (ข้อความ, รูปภาพ, วิดีโอ, เสียง) และระบบ "Universal Reference" ชั้นนำของอุตสาหกรรมที่ล็อกองค์ประกอบภาพ การเคลื่อนไหวของกล้อง และการกระทำของตัวละครในทุกช็อต ผสานรวมการควบคุมระดับผู้กำกับด้วยการเรียกใช้ API เพียงครั้งเดียว ในราคาคงที่ $0.09/วินาที รับคีย์ได้ทันที และไม่มีคิวรอ — พร้อมการรับประกันเวลาพร้อมใช้งานและการปฏิบัติตามข้อกำหนดระดับองค์กร Seedance 2.0 Native 4K เปิดใช้งานแล้ววันนี้!

ดูกลุ่ม

Grok Imagine

Grok Imagine API นำเสนอการสร้างภาพ วิดีโอ และเสียงของ xAI ให้นักพัฒนาในชุดเครื่องมือเดียว สามารถสร้างภาพความละเอียดสูงสุด 2K พร้อมการเรนเดอร์ข้อความหลายภาษา รวมถึงวิดีโอความยาวสูงสุด 15 วินาทีพร้อมเสียงที่ซิงโครไนซ์แบบเนทีฟและการแก้ไขตามข้อมูลอ้างอิง บน Atlas Cloud คีย์เดียวสามารถรัน Grok Imagine ได้ทุกโหมด คุณจึงสามารถสลับไปมาระหว่างภาพ วิดีโอ และเสียงได้โดยไม่ต้องตั้งค่าแยกกัน เริ่มต้นที่ $0.02 ต่อภาพ และ $0.05 ต่อวินาที

ดูกลุ่ม

Gemini Omni Flash

Gemini Omni API นำโมเดลสร้างและแก้ไขวิดีโอแบบมัลติโมดัลของ Google DeepMind ซึ่งเปิดตัวในงาน Google I/O 2026 มาสู่สแต็กของคุณ Gemini Omni ผสานเอนจินการใช้เหตุผลของ Gemini เข้ากับสื่อเชิงสร้างสรรค์ รองรับอินพุตทุกรูปแบบทั้งข้อความ รูปภาพ วิดีโอ และเสียง เพื่อสร้างผลลัพธ์ที่สอดคล้องกันและอิงตามความรู้ ปรับแต่งผลลัพธ์ผ่านการสนทนาอย่างเป็นธรรมชาติ ไม่ว่าจะเปลี่ยนวัตถุ เขียนฉากใหม่ หรือปรับสไตล์ โดยที่ฟิสิกส์ ตัวละคร และความต่อเนื่องยังคงเดิม Atlas Cloud ให้บริการ Gemini Omni Flash ครบทั้งไลน์อัป ทั้งการสร้างวิดีโอจากข้อความ การสร้างวิดีโอจากรูปภาพพร้อมรูปอ้างอิงสูงสุด 7 รูป และการสร้างวิดีโอจากรูปอ้างอิง ผ่าน API เดียวแบบครบวงจร ด้วยราคาต่อวินาทีที่โปร่งใสเริ่มต้นที่ $0.112 โดยไม่ต้องสมัครสมาชิก เริ่มสร้างได้เลยวันนี้

ดูกลุ่ม

GPT Image 2

GPT Image 2 API ช่วยให้นักพัฒนาสามารถเข้าถึงโมเดลรูปภาพล่าสุดของ OpenAI ซึ่งเป็นรุ่นสืบทอดจาก GPT Image 1.5 โดยสามารถสร้างและแก้ไขรูปภาพพร้อมกับการเรนเดอร์ข้อความที่แม่นยำทั้งในอักษรละตินและ CJK รวมถึงการจัดวางองค์ประกอบที่ยอดเยี่ยมสำหรับโปสเตอร์ ม็อกอัป และอินโฟกราฟิก บน Atlas Cloud คุณสามารถเข้าถึงโมเดลนี้ผ่าน API ที่เป็นหนึ่งเดียวร่วมกับโมเดลอื่นๆ อีกกว่า 300 รุ่น พร้อมเครดิตฟรี เวลาทำงาน 99.99% และไม่จำเป็นต้องมีการตรวจสอบยืนยันองค์กรจาก OpenAI

ดูกลุ่ม

Google

โมเดลเชิงสร้างสรรค์ที่ทรงพลังที่สุดของ Google พร้อมใช้งานแล้วบน Atlas Cloud โดย Veo 3.1 นำเสนอการสร้างวิดีโอระดับภาพยนตร์ Nano Banana 2 ขับเคลื่อนการสร้างภาพที่มีความเที่ยงตรงสูง และ Gemini นำความชาญฉลาดแบบมัลติโมดัลมาสู่ทุกเวิร์กโฟลว์ เข้าถึงชุดโมเดลของ Google เต็มรูปแบบผ่าน API key เดียวพร้อมความพร้อมใช้งานระดับ Day-0 และการกำหนดราคาแบบจ่ายตามการใช้งาน (pay-as-you-go)

ดูกลุ่ม

Seedance 2.0 Mini

Seedance 2.0 Mini นำเสนอการสร้างวิดีโอแบบมัลติโมดัลของ ByteDance สู่เวิร์กโฟลว์ที่ความเร็วและต้นทุนมีความสำคัญสูงสุด โดยมอบความสามารถหลักของ Seedance 2.0 ในรูปแบบที่ใช้ทรัพยากรน้อยลง — สร้างได้เร็วกว่า ต้นทุนต่อวิดีโอต่ำกว่า และใช้การผสานรวม API เดิมที่คุณใช้อยู่แล้ว สำหรับทีมที่จัดการไปป์ไลน์ปริมาณมากหรือสร้างต้นแบบในสเกลขนาดใหญ่ Mini คือตัวเลือกเริ่มต้นที่ใช้งานได้จริง

ดูกลุ่ม

ByteDance

ตั้งแต่การสร้างวิดีโอระดับภาพยนตร์ไปจนถึงการสร้างภาพที่มีความละเอียดสูง โมเดลที่ทรงพลังที่สุดของ ByteDance พร้อมใช้งานแล้วบน Atlas Cloud รัน Seedance และ Seedream ในสเกลขนาดใหญ่ด้วยราคาการอนุมานที่ต่ำที่สุด และไม่มีค่าใช้จ่ายแฝงด้านโครงสร้างพื้นฐาน

ดูกลุ่ม

Alibaba

Atlas Cloud รวบรวมโมเดลทั้งหมดของ Alibaba ไว้ใน API เดียว: Qwen สำหรับงานด้านภาษาและรูปภาพ และ Wan สำหรับการสร้างวิดีโอความละเอียดสูงสุด 1080p เข้าถึงทุกโมเดลในรูปแบบจ่ายตามการใช้งานจริง (pay-as-you-go) โดยไม่ต้องสมัครสมาชิก Alibaba API พร้อมใช้งานผ่าน base URL เดียวโดยใช้ไคลเอนต์ที่รองรับ OpenAI ที่คุณมีอยู่แล้ว

ดูกลุ่ม

OpenAI

Atlas Cloud ให้คุณเข้าถึงกลุ่มผลิตภัณฑ์ OpenAI API แบบครบวงจร ตั้งแต่ GPT Image 2 สำหรับการสร้างภาพถ่าย ไปจนถึง Sora 2 สำหรับวิดีโอ ทุกโมเดลพร้อมใช้งานแบบจ่ายตามการใช้งานจริง (pay-as-you-go) โดยไม่มีข้อผูกมัดรายเดือน เชื่อมต่อได้ง่ายดายด้วยการสลับ base URL เพียงจุดเดียวโดยใช้ API ที่เข้ากันได้กับ OpenAI

ดูกลุ่ม

xAI

สร้างไปป์ไลน์ภาพและวิดีโอที่สมบูรณ์โดยใช้ xAI API บน Atlas Cloud สร้างที่ความละเอียด 2K แก้ไขด้วยภาพอ้างอิง และทำให้ภาพเคลื่อนไหวเป็นคลิปที่ซิงค์กับเสียง

ดูกลุ่ม

Kwaivgi

Kwaivgi API ในราคาที่ถูกกว่าราคามาตรฐาน 15% Atlas Cloud มอบการเข้าถึง Day-0 สำหรับการเปิดตัว Kling ใหม่ด้วยการกำหนดราคาแบบจ่ายตามการใช้งานจริง (pay-as-you-go) และไม่จำกัดจำนวนผู้ใช้ บัญชีเดียว คีย์เดียว สำหรับโมเดล Kling ทุกรุ่นตั้งแต่ระดับมาตรฐานไปจนถึงระดับมาสเตอร์

ดูกลุ่ม

Seedream 5.0 Pro

Seedream 5.0 Pro API มอบโมเดลการแก้ไขภาพที่ควบคุมได้ของ ByteDance บน Atlas Cloud ให้กับนักพัฒนา โดยจะวางการแก้ไขอย่างแม่นยำด้วยจุดยึดและพิกัด แยกภาพออกเป็นเลเยอร์ที่แก้ไขได้ ผสานข้อมูลอ้างอิงหลายรายการ และจับคู่สีและวัสดุที่แน่นอน พร้อมข้อความหลายภาษาที่ความละเอียด 2K และ 3K บน Atlas Cloud คุณสามารถเข้าถึงได้ผ่านคีย์เดียว!

ดูกลุ่ม