
Kuaishou’s flagship video generation suite, Kling 3.0, features two powerhouse models—Kling 3.0 (Upgraded from Kling 2.6) and Kling 3.0 Omni (Kling O3, Upgraded from Kling O1)—both offering high-fidelity native audio integration. While Kling 3.0 excels in intelligent cinematic storytelling, multilingual lip-syncing, and precision text rendering, Kling O3 sets a new standard for professional-grade subject consistency by supporting custom subjects and voice clones derived from video or image inputs. Together, these models provide a comprehensive solution tailored for cinematic narratives, global marketing campaigns, social media content, and digital skit production.
Atlas Cloud มอบโมเดลสร้างสรรค์ล่าสุดที่นำหน้าในอุตสาหกรรมให้กับคุณ
Atlas Cloud มอบโมเดลสร้างสรรค์ล้ำสมัยชั้นนำของอุตสาหกรรมให้กับคุณ

มอบการลิปซิงค์ที่แม่นยำสำหรับหลายภาษาและสำเนียง (CN, EN, JP, KR, ES) สร้างประสบการณ์ที่สมจริง

"AI Director" ในตัวจะกำหนดมุมกล้องและขนาดภาพโดยอัตโนมัติ เพื่อการเล่าเรื่องแบบภาพยนตร์ด้วยการคลิกเพียงครั้งเดียว

โมเดล Omni รองรับ Video Inpainting และการแทนที่ตัวละคร ช่วยให้แก้ไขได้อย่างยืดหยุ่นและการแตกตัวของสื่อ (Material Fission)

การยึดโยงทางภาพเชิงลึกช่วยให้ตัวละคร อุปกรณ์ประกอบฉาก และฉากยังคงความเสถียรแม้ในระหว่างการเคลื่อนไหวที่ซับซ้อน

ก้าวข้ามขีดจำกัดด้านความยาวเพื่อสร้างเรื่องราวที่สมบูรณ์ มีจังหวะจะโคนที่โดดเด่น และมีโครงเรื่องครบถ้วนในรอบการทำงานเดียว
ต้นทุนต่ำที่สุด
| โมดาลิตี | คำอธิบาย |
|---|---|
| Kling 3.0 Std T2V API(Text To Video) | Kling 3.0 Std T2V API ช่วยให้นักพัฒนาสามารถแปลงพรอมต์ข้อความให้เป็นคลิปวิดีโอคุณภาพระดับภาพยนตร์ ด้วยการกำหนดกล้อง ฉาก และการเคลื่อนไหว ระบบจะสร้างเนื้อหาที่ลื่นไหลและซิงค์กับเสียง ซึ่งได้รับการปรับให้เหมาะสมสำหรับการทำสตอรี่บอร์ดระดับมืออาชีพ การตลาดแบบไดนามิก และการเล่าเรื่องผ่านโซเชียลมีเดีย |
| Kling 3.0 Std I2V API(Image To Video) | Kling 3.0 Std I2V API แปลงภาพนิ่งและข้อความพรอมต์ให้เป็นคลิปวิดีโอ ด้วยการรองรับการควบคุมเฟรมอ้างอิงและเฟรมสุดท้าย ระบบจะนำทางวิถีการเคลื่อนไหวและสร้างเนื้อหาที่ซิงค์กับเสียงเพื่อความต่อเนื่องทางสายตาและสินทรัพย์ทางการตลาดที่เป็นมาตรฐาน |
| Kling 3.0 Pro T2V API(Text To Video) | Kling 3.0 Pro T2V API สร้างวิดีโอความคมชัดสูงจากคำสั่งข้อความ (text prompts) ด้วยฟิสิกส์ขั้นสูงและพื้นผิวแบบภาพยนตร์ รองรับการเล่าเรื่องแบบหลายช็อต ให้รายละเอียดและความซับซ้อนทางภาพที่สูงกว่าเวอร์ชัน Standard |
| Kling 3.0 Pro I2V API(Image To Video) | Kling 3.0 Pro I2V API แปลงภาพนิ่งให้เป็นวิดีโอความละเอียดสูงพร้อมการเก็บรายละเอียดที่ดียิ่งขึ้น นำเสนอการควบคุมกล้องระดับมืออาชีพและการซิงโครไนซ์ภาพและเสียงที่แม่นยำสำหรับการผลิตเชิงพาณิชย์ระดับไฮเอนด์ |
| Kling Video O3 Std T2V API(Text To Video) | Kling Video O3 Std T2V API สร้างวิดีโอจากข้อความ รองรับการสร้างเสียงแบบเนทีฟ |
| Kling Video O3 Std I2V API(Image To Video) | Kling Video O3 Std I2V API ใช้รูปภาพและข้อความเพื่อสร้างวิดีโอที่มีความสอดคล้องกับต้นฉบับสูง ออกแบบมาสำหรับงานที่ต้องการการแสดงตัวละครหรือผลิตภัณฑ์ที่เสถียรภายในขั้นตอนการทำงานความละเอียดมาตรฐาน |
| Kling Video O3 Std R2V(Video To Video) | Kling Video O3 Std R2V API สร้างวิดีโอที่สร้างสรรค์โดยใช้การอ้างอิงตัวละคร อุปกรณ์ประกอบฉาก หรือฉาก รองรับภาพอ้างอิงสูงสุด 7 ภาพและอินพุตวิดีโอเสริม ช่วยให้สามารถปรับเปลี่ยนสไตล์วิดีโอและแก้ไขคุณลักษณะสำหรับเนื้อหาโซเชียลมีเดียคุณภาพมาตรฐานและเนื้อหาทดลอง |
| Kling Video O3 Std Video Edit API(Video To Video) | Kling Video O3 Std Video Edit API(Video To Video) ช่วยให้สามารถแก้ไขวิดีโอด้วยภาษาธรรมชาติ: ลบหรือแทนที่วัตถุ เปลี่ยนพื้นหลัง เพิ่มเอฟเฟกต์ และอื่น ๆ |
| Kling Video O3 Pro T2V API(Text To Video) | Kling Video O3 Pro T2V API ให้บริการสร้างวิดีโอจากข้อความ โดยมอบความสม่ำเสมอของตัวละครระดับมืออาชีพและการจัดแสงแบบภาพยนตร์ในฉากที่ซับซ้อน เพื่อการเล่าเรื่องคุณภาพระดับภาพยนตร์ |
| Kling Video O3 Pro I2V API(Image To Video) | Kling Video O3 Pro I2V API แปลงภาพนิ่งเป็นวิดีโอคุณภาพระดับมืออาชีพโดยใช้สถาปัตยกรรมแบบ Reference-first ช่วยให้มั่นใจได้ถึงการเก็บรายละเอียดภาพที่มีความเที่ยงตรงสูงและการเคลื่อนไหวที่ลื่นไหล สำหรับการตลาดดิจิทัลระดับพรีเมียมและวิชวลเอฟเฟกต์ |
| Kling Video O3 Pro R2V(Video To Video) | Kling Video O3 Pro R2V นำเสนอการแปลงวิดีโอและการปรับเปลี่ยนสไตล์ โดยยังคงการควบคุมระดับพิกเซลและความเสถียรของการเคลื่อนไหวสำหรับการตัดต่อวิดีโอระดับมืออาชีพและการปรับเปลี่ยนภาพระดับไฮเอนด์ |
| Kling Video O3 Pro Video Edit(Video To Video) | Kling Video O3 Pro Video Edit (Video To Video) ช่วยให้การแก้ไขวิดีโอคุณภาพสูงทำได้ง่ายผ่านคำสั่งภาษาธรรมชาติ (prompts) ระบบรองรับการลบวัตถุขั้นสูง การแทนที่พื้นหลัง และการผสมผสานเอฟเฟกต์ด้วยความแม่นยำระดับมืออาชีพพร้อมการรักษาความละเอียดของรายละเอียดอย่างครบถ้วน |
การผสมผสานโมเดลขั้นสูงกับแพลตฟอร์มเร่งความเร็ว GPU ของ Atlas Cloud มอบความเร็ว ความสามารถในการปรับขนาด และการควบคุมเชิงสร้างสรรค์ที่ไม่มีใครเทียบได้สำหรับการสร้างภาพและวิดีโอ
Kling 3.0 เปิดตัว "AI Director" ที่เข้าใจการดำเนินเรื่องจากพรอมต์ (prompts) ได้อย่างเป็นธรรมชาติ โดยจะจัดองค์ประกอบช็อตและมุมกล้องโดยอัตโนมัติเพื่อสร้างเทคนิคทางภาพยนตร์ขั้นสูง เช่น ฉากสนทนาแบบ shot-reverse-shot นำเสนอการเล่าเรื่องด้วยภาพที่สมบูรณ์แบบในการสร้างเพียงครั้งเดียว ทำให้การแสดงออกทางภาพยนตร์ที่ซับซ้อนเข้าถึงได้สำหรับครีเอเตอร์ทุกคน
Kling 3.0 ประสบความสำเร็จในการจับคู่ที่แม่นยำระหว่างข้อความและตัวอักษรภาพ รองรับบทสนทนาภาษาผสม (จีน อังกฤษ ญี่ปุ่น เกาหลี สเปน ฯลฯ) และภาษาถิ่นด้วยการลิปซิงค์ที่ลื่นไหลเป็นธรรมชาติ ตอบโจทย์ความต้องการของอีคอมเมิร์ซและการตลาดระดับโลกสำหรับการแสดงข้อความที่มีความเที่ยงตรงสูงและการผลิตเนื้อหาที่ปรับให้เข้ากับท้องถิ่น
Kling O3 รองรับการดึงคุณลักษณะของตัวละครจากวิดีโอที่อัปโหลดหรือถ่ายทำความยาว 3–8 วินาที โดยคืนสภาพรูปลักษณ์ สรีระ และออร่าของตัวละครได้อย่างสมบูรณ์แบบ สิ่งนี้ปลดล็อกความตื่นเต้นในการสร้างสรรค์ของการ "แสดงนำในภาพยนตร์ของคุณเอง" ทำให้เหมาะอย่างยิ่งสำหรับละครสั้นและเนื้อหาแบบซีรีส์ที่ต้องการความคงที่ของตัวละครสูง
ค้นพบกรณีการใช้งานจริงและเวิร์กโฟลว์ที่คุณสามารถสร้างด้วยตระกูลโมเดลนี้ — ตั้งแต่การสร้างเนื้อหาและระบบอัตโนมัติไปจนถึงแอปพลิเคชันระดับโปรดักชัน
Kling 3.0 ใช้การสร้างแบบจำลองทางฟิสิกส์ขั้นสูงเพื่อสร้างปฏิสัมพันธ์ที่สมจริงระหว่างวัตถุที่ซับซ้อน รวมถึงพลศาสตร์ของไหล การเคลื่อนไหวของผ้า และการชนกันของโครงสร้าง ด้วยการจำลองแรงโน้มถ่วงและคุณสมบัติของวัสดุในโลกแห่งความเป็นจริง API นี้จะสร้างการเคลื่อนไหวที่มีความคมชัดสูง เหมาะสำหรับเอฟเฟกต์ภาพระดับมืออาชีพ โฆษณาสินค้าที่สมจริง และการสาธิตทางเทคนิคที่ต้องการความแม่นยำทางฟิสิกส์ที่เที่ยงตรง
ด้วยการใช้ประโยชน์จากเทคโนโลยีที่ขับเคลื่อนด้วยการอ้างอิง Kling 3.0 จึงรักษาความสม่ำเสมอของตัวละครและรูปแบบอย่างเคร่งครัดในคลิปที่สร้างขึ้นหลายรายการ ความสามารถนี้ช่วยให้นักพัฒนาสามารถสร้างลำดับภาพหลายช็อตที่เชื่อมโยงกันด้วยลักษณะใบหน้าและแสงสว่างในสภาพแวดล้อมที่มั่นคง เป็นโซลูชันที่เหมาะอย่างยิ่งสำหรับการสร้างมนุษย์ดิจิทัล การเล่าเรื่องแบบต่อเนื่อง และแคมเปญการตลาดที่สอดคล้องกับแบรนด์ซึ่งต้องการความสม่ำเสมอทางภาพ
Kling 3.0 API ช่วยให้สามารถปรับเปลี่ยนวิดีโอเป็นวิดีโอ (video-to-video) ที่ซับซ้อนได้ผ่านคำสั่งภาษาธรรมชาติ รองรับการเปลี่ยนพื้นหลัง การลบวัตถุ และการถ่ายโอนสไตล์ได้อย่างแนบเนียน ด้วยการรักษาโครงสร้างการเคลื่อนไหวแบบดั้งเดิมในขณะที่ปรับเปลี่ยนคุณลักษณะทางภาพที่เฉพาะเจาะจง API นี้ช่วยลดขั้นตอนการทำงานหลังการผลิตสำหรับเอเจนซี่สร้างสรรค์และแพลตฟอร์มโซเชียลมีเดียที่ต้องการการทำซ้ำเนื้อหาที่มีประสิทธิภาพและความละเอียดสูง
ดูว่าโมเดลจากผู้ให้บริการต่างๆ เปรียบเทียบกันอย่างไร — เปรียบเทียบประสิทธิภาพ ราคา และจุดแข็งเฉพาะตัวเพื่อตัดสินใจอย่างมีข้อมูล
| โมเดล | ประเภทอินพุต | ระยะเวลาของผลลัพธ์ | ความละเอียด | การสร้างเสียง |
|---|---|---|---|---|
| Kling 3.0 | ข้อความ, รูปภาพ, วิดีโอ | 5s;10s | 720P | √ |
| Kling O1 | ข้อความ, รูปภาพ | 5s;10s | 720P | × |
| Kling 2.6 | ข้อความ, รูปภาพ, วิดีโอ | 5s;10s | 720P | √ |
| Seedance 2.0 | ข้อความ, รูปภาพ, วิดีโอ, เสียง | 4~15s | 2K, 1080P, 720P, 480P | √ |
| Veo 3.1 | ข้อความ, รูปภาพ | 4s, 6s, 8s | 1080P, 720P | √ |
| Wan 2.6 | ข้อความ, รูปภาพ, วิดีโอ, เสียง | 5s, 10s, 15s | 1080P, 720P | √ |
| Hailuo 2.3 | ข้อความ, รูปภาพ | 5s | 1080P | × |
Get started in minutes — follow these simple steps to integrate and deploy models through Atlas Cloud’s platform.
Sign up at atlascloud.ai and complete verification. New users receive free credits to explore the platform and test models.
การรวมโมเดล Kling3.0 Models ขั้นสูงเข้ากับแพลตฟอร์มที่เร่งด้วย GPU ของ Atlas Cloud ให้ประสิทธิภาพ ความสามารถในการขยาย และประสบการณ์นักพัฒนาที่ไม่มีใครเทียบได้
เวลาแฝงต่ำ:
inference ที่ปรับแต่ง GPU เพื่อการตอบสนองแบบเรียลไทม์
API แบบรวมศูนย์:
รัน Kling3.0 Models, GPT, Gemini และ DeepSeek ด้วยการเชื่อมต่อเดียว
ราคาโปร่งใส:
ชำระเงินต่อโทเค็นที่คาดเดาได้พร้อมตัวเลือก serverless
ประสบการณ์นักพัฒนา:
SDK, การวิเคราะห์, เครื่องมือปรับแต่ง และเทมเพลต
ความน่าเชื่อถือ:
ความพร้อมใช้งาน 99.99%, RBAC และการบันทึกที่พร้อมสำหรับการปฏิบัติตาม
ความปลอดภัยและการปฏิบัติตาม:
SOC 2 Type II, สอดคล้อง HIPAA, อธิปไตยข้อมูลในสหรัฐอเมริกา
ด้วยการบูรณาการการอ้างอิงวัตถุวิดีโอ การอ้างอิงวัตถุรูปภาพ และการอ้างอิงเสียง/น้ำเสียง
เวอร์ชัน Standard สร้างความสมดุลระหว่างความเร็วในการสร้างและคุณภาพ ทำให้เหมาะสำหรับเนื้อหาโซเชียลมีเดียและการสร้างต้นแบบอย่างรวดเร็ว ส่วนเวอร์ชัน Pro ได้รับการออกแบบมาเพื่อความต้องการด้านภาพยนตร์และวิดีโอระดับมืออาชีพ โดยมอบการจำลองพลวัตทางฟิสิกส์ที่สมจริงยิ่งขึ้นและผลลัพธ์พื้นผิววัสดุที่ละเอียดยิ่งขึ้น
R2V มุ่งเน้นไปที่ "การปรับเปลี่ยนรูปแบบโดยรวม" เช่น การแปลงวิดีโอคนแสดงจริง (live-action) ให้เป็นสไตล์แอนิเมชันหรือศิลปะที่สมจริง ในทางตรงกันข้าม Video Edit มุ่งเน้นไปที่ "การแก้ไขตามคำสั่ง" ซึ่งช่วยให้สามารถดำเนินการขั้นตอนหลังการผลิต (post-production) ได้อย่างแม่นยำ เช่น การเพิ่ม การลบ หรือการแก้ไของค์ประกอบเฉพาะภายในวิดีโอ
Join the Discord community for the latest model updates, prompts, and support.