
Xây dựng quy trình sản xuất video trên Shengshu API: Chỉ với một lần gọi, Vidu Q3 tạo ra các đoạn phim điện ảnh dài 16 giây với âm thanh gốc và chuyển cảnh camera thông minh.
Tạo video điện ảnh độ trung thực cao từ văn bản và hình ảnh với các mô hình AI tạo video mới nhất trên Atlas Cloud.
Compare standard vs. our pricing across every ShengShu model.
| Model | Standard Price (USD) | Our Price (USD) | Discount | |
|---|---|---|---|---|
| Vidu Q3-Mix Reference to Video | $0.125 | Start from$0.106/s video | -15% | View |
| Vidu Q3 Reference to Video | $0.05 | Start from$0.042/s video | -15% | View |
| Vidu Q3-Pro Start-end-to-video | $0.05 | Start from$0.042/s video | -15% | View |
| Vidu Q3-Turbo Image-to-video | $0.04 | Start from$0.034/s video | -15% | View |
| Vidu Q3-Turbo Start-end-to-video | $0.04 | Start from$0.034/s video | -15% | View |
| Vidu Q3-Turbo Text-to-video | $0.04 | Start from$0.034/s video | -15% | View |
Instantly explore and experiment with 300+ production-ready models in the Atlas Playground. Start customizing with one click.
Các video ngắn 16 giây, âm thanh gốc và tính nhất quán đa tham chiếu của Vidu Q3 làm cho quy trình làm việc trở nên thiết thực đối với những công việc trước đây từng đòi hỏi một đội ngũ sản xuất. Các nhóm sử dụng các cấp độ Q3 khác nhau để chuyển từ bước lặp lại nhanh chóng sang các tài sản hoàn thiện mà không cần đổi nhà cung cấp.
Các studio và nhà sáng tạo độc lập sử dụng Vidu Q3-Mix để tạo ra nội dung hoạt hình nhiều tập, trong đó các nhân vật trông giống hệt nhau trong mọi cảnh. Bằng cách tải lên các bảng tham chiếu nhân vật, mỗi đoạn phim mới sẽ thừa hưởng các đặc điểm khuôn mặt, trang phục và phong cách hình ảnh tương tự mà không cần phải làm việc thủ công để đảm bảo tính nhất quán của từng khung hình. Shengshu đã trình diễn quy trình làm việc này tại SXSW 2026 với tư cách là giải pháp AI đầu tiên cho việc sản xuất phim hoạt hình dài tập.
Các nhóm tiếp thị tải lên hình ảnh tham chiếu của nhân vật thương hiệu một lần và sử dụng Vidu Q3 Reference-to-Video để tạo hàng chục clip ngắn cho TikTok, Reels và YouTube Shorts. Nhân vật giữ nguyên đặc điểm hình ảnh trên mọi kết quả đầu ra, loại bỏ nút thắt trong thiết kế khi phải tóm tắt và phê duyệt riêng lẻ từng tài nguyên. Với mức giá 0,042 đô la mỗi giây trên Atlas Cloud, một lô đầy đủ các clip 10 giây có giá chưa đến một đô la cho mỗi clip.
Các nhóm thương mại điện tử cung cấp hình ảnh sản phẩm từ nhiều góc độ làm dữ liệu đầu vào tham chiếu và tạo ra các đoạn phim tiếp thị điện ảnh hiển thị sản phẩm chuyển động cùng với âm thanh môi trường nguyên bản. Đầu ra được cung cấp kèm theo âm thanh đồng bộ trong cùng một lần gọi, sẵn sàng cho các quảng cáo và trang sản phẩm mà không cần quay video hay chỉnh sửa âm thanh. Tính năng kiểm soát khung hình bắt đầu và kết thúc cho phép các nhóm chỉ đạo chính xác cách sản phẩm được hiển thị qua từng đoạn phim.
Các đạo diễn sử dụng tính năng điều khiển máy ảnh của Vidu Q3-Pro để tạo các clip tiền trực quan hóa với các chuyển động được chỉ định — đẩy vào chủ thể, lia máy ngang qua bối cảnh, các cảnh quay theo dõi nhân vật. Đầu ra 16 giây gốc có nghĩa là có thể tiền trực quan hóa toàn bộ một cảnh ngắn chỉ trong một lần gọi. Điều này thay thế cho công việc vẽ kịch bản phân cảnh ở giai đoạn đầu bằng tài liệu tham khảo chính xác về chuyển động cho dàn diễn viên và đoàn làm phim.
Các nhóm phát triển sử dụng Vidu Q3-Turbo để chạy các đường ống tạo hàng loạt với mức phí 0,034 đô la mỗi giây, sản xuất hàng chục video ngắn từ đầu vào văn bản hoặc hình ảnh mỗi giờ. Chi phí mỗi giây thấp hơn khiến việc tạo và thử nghiệm nhiều biến thể sáng tạo trở nên thiết thực trước khi chọn biến thể nào để mở rộng quy mô với Q3-Pro. Cả hai mô hình đều chạy dưới cùng một khóa API Atlas Cloud chỉ với một thay đổi tham số duy nhất giữa các cấp độ.
Các tổng cục du lịch và nền tảng du lịch sử dụng công cụ chuyển văn bản thành video Vidu Q3-Pro để tạo các đoạn phim điểm đến đầy không khí với âm thanh môi trường tự nhiên từ các lời nhắc văn bản mô tả. Một mô tả cảnh bằng văn bản về một cảnh quan, địa danh hoặc bối cảnh văn hóa sẽ tạo ra một đoạn phim điện ảnh dài 16 giây với âm thanh phù hợp chỉ trong một lệnh gọi API. Điều này mang lại một giải pháp thay thế tiết kiệm chi phí cho việc quay phim tại địa điểm đối với nội dung thúc đẩy ý định đặt phòng.
Vidu Q3 tạo ra video liên tục lên đến 16 giây chỉ trong một lần gọi API duy nhất ở độ phân giải 1080p và 24fps. Đây là cửa sổ tạo video một lần (single-pass) dài nhất trong số các mô hình video hàng đầu cùng phân khúc. Thời lượng video có thể được định cấu hình cho mỗi lần gọi trong phạm vi tối đa đó.
Có. Vidu Q3 tạo ra lời thoại, hiệu ứng âm thanh, nhạc nền và đồng bộ khẩu hình cùng lúc với các khung hình video chỉ trong một quá trình suy luận duy nhất. Không có bước lồng tiếng hậu kỳ hoặc căn chỉnh âm thanh thủ công. Thời gian âm thanh và hành động trên màn hình được đồng bộ hóa tự động.
Bạn có thể mô tả trực tiếp chuyển động của camera trong prompt văn bản — push-in, pan, tracking shot — và mô hình sẽ thực hiện chúng ngay từ khung hình đầu tiên. Không cần thêm tham số hay lớp điều khiển riêng biệt. Điều này áp dụng cho cả endpoint text-to-video và image-to-video trên Atlas Cloud.
Vidu Q3-Pro mang đến chất lượng đầu ra chuẩn điện ảnh với chuyển động mượt mà và chi tiết phong phú, có giá 0,042 USD mỗi giây trên Atlas Cloud. Vidu Q3-Turbo tạo với tốc độ cao hơn cùng chi phí mỗi giây thấp hơn là 0,034 USD, rất phù hợp cho các bản nháp và lặp lại nhanh chóng. Cả hai đều có chung độ phân giải đầu ra 1080p và hỗ trợ âm thanh gốc.
Điểm cuối Reference-to-Video của Vidu Q3 chấp nhận từ 1 đến 4 hình ảnh tham chiếu cho mỗi lần gọi. Bạn có thể kết hợp các chủ thể, môi trường, trang phục và phong cách hình ảnh từ các hình ảnh khác nhau trong một lần tạo. Đây là cách chính để duy trì tính nhất quán của nhân vật và cảnh quay qua nhiều clip.
Vidu Q3-Mix là mô hình tham chiếu cấp cao nhất trong dòng sản phẩm Vidu Q3, có giá 0,106 USD mỗi giây trên Atlas Cloud. Mô hình này mang lại tính nhất quán đa chủ thể mạnh mẽ nhất khi kết hợp nhiều hình ảnh tham chiếu trong một lần tạo. Nó được thiết kế cho các quy trình làm việc như sản xuất phim hoạt hình dài tập và nội dung có thương hiệu, nơi đặc điểm nhận dạng của nhân vật phải được giữ nguyên về mặt hình ảnh trên nhiều đoạn clip.
Có. Cả Vidu Q3-Pro và Q3-Turbo đều có endpoint Start-end-to-video trên Atlas Cloud. Bạn cung cấp hình ảnh khung hình bắt đầu và mô tả chuyển động hoặc trạng thái kết thúc mong muốn, sau đó mô hình sẽ tạo ra sự chuyển tiếp. Điều này mang lại khả năng kiểm soát đạo diễn chính xác về cách mỗi cảnh quay mở đầu và kết thúc.
Vidu Q3-Turbo bắt đầu từ 0,034 USD mỗi giây. Vidu Q3-Pro và endpoint Reference-to-Video có giá 0,042 USD mỗi giây. Vidu Q3-Mix, mô hình tham chiếu có tính nhất quán cao nhất, có giá 0,106 USD mỗi giây. Tất cả các cấp độ đều có giá thấp hơn 15% so với mức giá tiêu chuẩn của Shengshu API và có sẵn theo hình thức thanh toán theo mức sử dụng (pay-as-you-go).
Join the Discord community for the latest model updates, prompts, and support.