DeepSeek AI Models on AtlasCloud

Atlas Cloud lưu trữ toàn bộ chuỗi sản phẩm DeepSeek thông qua DeepSeek API: V3.2, V4 và R1. Các mô hình hỗ trợ ngữ cảnh từ 128K đến 1M token, tất cả đều là mã nguồn mở và thanh toán theo mức sử dụng (pay-as-you-go).

Large Language Models by DeepSeek

Thúc đẩy trò chuyện, suy luận và tác tử ở quy mô lớn với các mô hình ngôn ngữ lớn hàng đầu, được cung cấp nhanh chóng và tiết kiệm trên Atlas Cloud.

Xem tất cả mô hình

DeepSeek Models API Pricing Details

Compare standard vs. our pricing across every DeepSeek model.

ModelStandard Price (USD)Our Price (USD)Discount
DeepSeek V4 Pro
$1.74/$3.45per 1M tokens1048.6K context
$1.68/$3.38M in/outper 1M tokens1048.6K context
View
DeepSeek V4 Flash
$0.14/$0.28per 1M tokens1048.6K context
$0.14/$0.28M in/outper 1M tokens1048.6K context
View
DeepSeek V3.2
$0.287/$0.431per 1M tokens163.8K context
$0.26/$0.38M in/outper 1M tokens163.8K context
View
DeepSeek V3.2 Exp
$0.287/$0.43per 1M tokens163.8K context
$0.27/$0.41M in/outper 1M tokens163.8K context
View
DeepSeek-V3-0324
$0.287/$1.147per 1M tokens131.1K context
$0.216/$0.88M in/outper 1M tokens131.1K context
View
DeepSeek-R1-0528
$0.574/$2.294per 1M tokens131.1K context
$0.55/$2.15M in/outper 1M tokens131.1K context
View

Explore models from other providers

Instantly explore and experiment with 300+ production-ready models in the Atlas Playground. Start customizing with one click.

Các trường hợp sử dụng API DeepSeek mà bạn có thể xây dựng trên Atlas Cloud

Các mô hình mã nguồn mở của DeepSeek bao phủ toàn bộ phạm vi từ các tác vụ thông lượng cao, tiết kiệm chi phí đến lập trình agentic tiên tiến với ngữ cảnh 1M. Các nhóm có thể lựa chọn giữa V3.2, V4 Flash và V4 Pro dựa trên các yêu cầu về ngữ cảnh và độ phức tạp của tác vụ.

Giải Quyết Issue GitHub Tự Chủ

Các nhóm kỹ thuật sử dụng DeepSeek V4 Pro để xây dựng các tác nhân lập trình tự động giải quyết các vấn đề GitHub thực tế, bao gồm việc đọc mô tả vấn đề, theo dõi các phụ thuộc chéo giữa các tệp, viết bản sửa lỗi và chạy thử nghiệm. V4 Pro đạt 80,6% trên SWE-Bench Verified, chỉ chênh lệch 0,2 điểm so với Claude Opus 4.6 và được tích hợp nguyên bản với các framework tác nhân Claude Code, OpenCode và OpenClaw. Việc chuyển đổi từ mô hình nguồn đóng sang DeepSeek V4 trên Atlas Cloud chỉ yêu cầu thay đổi URL cơ sở trong thiết lập SDK hiện tại.

Phân tích toàn bộ cơ sở mã với ngữ cảnh 1M

Các nhóm phát triển sử dụng cửa sổ ngữ cảnh 1M token của DeepSeek V4 để tải toàn bộ một kho lưu trữ trong một lệnh gọi API duy nhất cho việc phân tích chéo tệp, theo dõi phụ thuộc và đánh giá kiến trúc. V4 đạt độ chính xác 97% trong bài kiểm tra đa truy vấn "Needle in a Haystack" ở độ dài ngữ cảnh tối đa, điều này có nghĩa là các thông tin cụ thể được nhúng ở bất kỳ đâu trong một triệu token đều có thể được trích xuất một cách đáng tin cậy. Ở ngữ cảnh 1M đầy đủ, V4 Pro chỉ yêu cầu 27% tài nguyên tính toán suy luận và 10% bộ nhớ đệm KV so với V3.2 cho cùng một tác vụ.

Triển khai tự lưu trữ cho các khối lượng công việc nhạy cảm với dữ liệu

Các nhóm doanh nghiệp có yêu cầu về tuân thủ hoặc quyền riêng tư dữ liệu sử dụng giấy phép MIT của DeepSeek để tự lưu trữ V4 Flash hoặc V3.2 trên cơ sở hạ tầng của riêng họ. Đây là một tùy chọn mà các mô hình nguồn đóng như GPT-5 và Claude Opus không thể cung cấp và nó loại bỏ sự phụ thuộc vào API đối với các ngành được quản lý. V4 Flash với 284 tỷ tham số và 13 tỷ tham số hoạt động là mục tiêu tự lưu trữ thực tế; trong khi V4 Pro yêu cầu một cụm máy chủ (cluster).

Giải Pháp Thay Thế Mô Hình Đóng Tiết Kiệm Chi Phí

Các nhóm chuyển đổi từ GPT-5 hoặc Claude Opus sử dụng DeepSeek V3.2 như một giải pháp thay thế liền mạch (drop-in replacement) thông qua endpoint tương thích với OpenAI trên Atlas Cloud. V3.2 có giá khoảng 0,27 USD cho mỗi triệu token đầu vào trong khi vẫn đạt được hiệu suất ngang tầm GPT-5 trên hầu hết các benchmark suy luận. Cùng một mã SDK sẽ định tuyến đến DeepSeek chỉ với một thay đổi URL cơ sở duy nhất, giúp việc di chuyển (migration) ít rủi ro hơn.

Biến tm nhìn doanh nghip ca bn thành hin thc vi Atlas Cloud AI.

Liên hệ kinh doanh

Frequently Asked Questions about DeepSeek AI Models

DeepSeek V4 là sản phẩm chủ lực thế hệ hiện tại, ra mắt ngày 24 tháng 4 năm 2026, bao gồm cả luồng công việc đa mục đích và suy luận trong một mô hình duy nhất. R1 từng là một mô hình suy luận độc lập, nhưng chế độ suy nghĩ của V4 thay thế nó bằng chính khả năng chuỗi suy nghĩ (chain-of-thought) được tích hợp trực tiếp. Bí danh deepseek-reasoner cũ sẽ ngừng hoạt động vào ngày 24 tháng 7 năm 2026, vì vậy các bản tích hợp mới nên sử dụng V4 Pro đã bật chế độ suy nghĩ.

Engram Memory là một hệ thống truy xuất kiến thức bên ngoài trong DeepSeek V4, được lấy cảm hứng từ cách hồi hải mã của não người lưu trữ và truy xuất thông tin. Nó sử dụng băm nhạy cảm cục bộ để truy xuất kiến thức liên quan với tốc độ O(1), thay vì buộc mô hình phải lưu trữ tất cả các sự kiện trong trọng số của nó. Điều này đã góp phần làm cho độ chính xác của thử nghiệm Needle in a Haystack đa truy vấn của V4 tăng vọt từ 84,2% trong V3.2 lên 97,0%.

Có. DeepSeek V3.2, V4 Flash và V4 Pro đều được phát hành theo giấy phép MIT, cho phép sử dụng, sửa đổi và phân phối với mục đích thương mại. Việc tự lưu trữ (self-host) V4 Flash rất khả thi trên phần cứng có đủ khả năng. V4 Pro yêu cầu một cụm máy chủ (cluster) vì có kích thước lên tới 1,6 nghìn tỷ tham số, do đó hầu hết các nhóm sử dụng quyền truy cập API trên Atlas Cloud để thay thế.

V4 Pro là một mô hình MoE với 1,6 nghìn tỷ tham số và 49 tỷ tham số hoạt động, được xây dựng cho các tác vụ suy luận phức tạp, lập trình và tác tử. V4 Flash là một mô hình có 284 tỷ tham số với 13 tỷ tham số hoạt động, được tối ưu hóa về tốc độ và hiệu quả chi phí cho các tác vụ ít đòi hỏi hơn. Cả hai đều chia sẻ cửa sổ ngữ cảnh 1M token và kiến trúc Engram Memory.

DeepSeek V4 hỗ trợ cửa sổ ngữ cảnh nguyên bản 1 triệu token cho cả hai biến thể Pro và Flash, với đầu ra tối đa là 393K token mỗi phản hồi. DeepSeek V3.2 có cửa sổ ngữ cảnh 128K. Ngữ cảnh 1M trong V4 làm cho nó trở nên thiết thực cho việc phân tích toàn bộ cơ sở mã, xử lý tài liệu lớn và các phiên tác nhân mở rộng chỉ trong một lệnh gọi duy nhất.

Có. DeepSeek V3.2 vẫn được cung cấp trên Atlas Cloud, với mức giá khoảng 0,27 đô la cho mỗi triệu token đầu vào. Đây là mô hình MoE có 685 tỷ tham số với 37 tỷ tham số hoạt động và cửa sổ ngữ cảnh 128K, được phát hành theo giấy phép MIT. Đây là một lựa chọn tiết kiệm chi phí cho các tác vụ không yêu cầu ngữ cảnh 1M của V4 hoặc Engram Memory.

DeepSeek V4 Pro giải quyết hơn 80,9% các vấn đề lập trình trong thế giới thực trên SWE-Bench, nhắm đến hiệu suất cấp độ GPT-5. Độ chính xác ngữ cảnh dài đa truy vấn đã tăng lên 97,0% trên Needle in a Haystack, so với 84,2% ở phiên bản V3.2. Biến thể V3.2 Speciale trên Atlas Cloud cũng đã đạt được hiệu suất huy chương vàng trong toán học cạnh tranh IMO 2025 và IOI 2025.

Khám phá Thêm Dòng

Seedance 2.0 Models

Seedance 2.0(by Bytedance) is a multimodal video generation model that redefines "controllable creation," moving beyond the limitations of text or start/end frames. It supports quad-modal inputs—text, image, video, and audio—and introduces an industry-leading "Universal Reference" system. By precisely replicating the composition, camera movement, and character actions from reference assets, Seedance 2.0 solves critical issues with character consistency and physical coherence, empowering creators to act as true "directors" with deep control over their output.

Xem Dòng

Grok-Imagine Models

Grok Imagine Image Quality is xAI's latest AI image generation model, delivering studio-grade visuals with up to 2K resolution and razor-sharp detail. It offers best-in-class text rendering across multiple languages, photorealistic outputs with natural lighting, rich textures, and believable physics, plus tighter prompt following and image editing with reference inputs for precise creative control. Ideal for hero images, ad creatives, product renders, and brand-grade visuals.

Xem Dòng

Gemini Omni

Gemini Omni (by Google DeepMind) is a video generation and editing model launched on May 20, 2026 at Google I/O that redefines the standard for "reasoning-driven creation," built specifically to solve the core challenge of AI video: making output that actually understands what you mean, not just what you type. It fuses Gemini's reasoning engine with generative capability, accepting any mix of images, text, video, and audio to produce consistent, knowledge-grounded output. Unlike models that start from scratch each time, Omni lets you edit through natural conversation — swapping objects, rewriting scenes, shifting styles — while keeping physics, characters, and continuity intact across every turn.

Xem Dòng

GPT Image 2 Models

GPT Image 2 is a state-of-the-art multimodal foundation model engineered for exceptional text-to-image generation with unprecedented photorealism and creative versatility. Developed by OpenAI as the evolution of the DALL-E lineage, it transforms detailed natural language descriptions into hyper-realistic imagery at up to 4K resolution. With proprietary "Neural Rendering Engine" technology for precise visual control, GPT Image 2 delivers studio-quality results with accurate anatomy, lighting, and composition—making it the premier AI tool for professional creators, enterprises, and developers demanding production-ready visual assets.

Xem Dòng

Google Models on Atlas Cloud | Gemini, Nano Bananas & Veo

Các mô hình sáng tạo mạnh mẽ nhất của Google hiện đều có sẵn trên Atlas Cloud. Veo 3.1 cung cấp khả năng tạo video đậm chất điện ảnh, Nano Banana 2 hỗ trợ tạo hình ảnh có độ chân thực cao, và Gemini mang trí tuệ đa phương thức vào mọi quy trình làm việc. Truy cập toàn bộ bộ mô hình Google thông qua một API key duy nhất với tính khả dụng Day-0 và mức giá dùng bao nhiêu trả bấy nhiêu (pay-as-you-go).

Xem Dòng

ByteDance Models on Atlas Cloud | Seedance & Seedream

Từ tạo video điện ảnh đến kiến tạo hình ảnh có độ trung thực cao, các mô hình mạnh mẽ nhất của ByteDance hiện đã có mặt trên Atlas Cloud. Chạy Seedance và Seedream ở quy mô lớn với mức giá suy luận thấp nhất và không có chi phí quản lý cơ sở hạ tầng.

Xem Dòng

Alibaba Models on Atlas Cloud | Wan & Qwen

Atlas Cloud tập hợp toàn bộ dòng mô hình của Alibaba dưới một API duy nhất: Qwen cho các tác vụ ngôn ngữ và hình ảnh, Wan để tạo video với độ phân giải lên đến 1080p. Truy cập mọi mô hình theo hình thức dùng đến đâu trả tiền đến đó (pay-as-you-go) mà không cần đăng ký gói. Alibaba API có sẵn thông qua một URL cơ sở (base URL) duy nhất bằng cách sử dụng ứng dụng khách tương thích với OpenAI hiện có của bạn.

Xem Dòng

MAI Image 2.5 Models

MAI-Image-2.5 là dòng mô hình chỉnh sửa và tạo hình ảnh chân thực mới nhất của Microsoft, được xây dựng cho thiết kế thương mại, nhiếp ảnh sản phẩm và tạo nội dung sẵn sàng cho thương hiệu. Có sẵn trong các biến thể tiêu chuẩn và Flash cho cả việc tạo hình ảnh từ văn bản và chỉnh sửa hình ảnh, nó mang lại điểm số Arena ELO tốt nhất trong phân khúc với mức giá cạnh tranh — chỉ từ 0,03 đô la cho mỗi hình ảnh. Với khả năng hiển thị văn bản chính xác, khả năng chỉnh sửa sắc sảo như phẫu thuật và tạo chân dung tự nhiên, MAI-Image-2.5 được thiết kế cho các nhóm cần hình ảnh chất lượng sản xuất mà không phải chịu chi phí xử lý hậu kỳ.

Xem Dòng

Wan2.7 Models

Launching this March, Wan2.7 is the latest powerhouse in the Qwen ecosystem, delivering a massive upgrade in visual fidelity, audio synchronization, and motion consistency over version 2.6. This all-in-one AI video generator supports advanced features like first-and-last frame control, 3x3 grid synthesis, and instruction-based video editing. Outperforming competitors like Jimeng, Wan2.7 offers superior flexibility with support for real-person image inputs, up to five video references, and 1080P high-definition outputs spanning 2 to 15 seconds, making it the premier choice for professional digital storytelling and high-end content marketing.

Xem Dòng

Nano Banana2 Models

Nano Banana 2 (by Google), is a generative image model that perfectly balances lightning-fast rendering with exceptional visual quality. With an improved price-performance ratio, it achieves breakthrough micro-detail depiction, accurate native text rendering, and complex physical structure reconstruction. It serves as a highly efficient, commercial-grade visual production tool for developers, marketing teams, and content creators.

Xem Dòng

Hunyuan 3D Generation Models

Hunyuan3D is a state-of-the-art 3D generative foundation model from Tencent that turns text prompts and single images into high-quality, textured 3D meshes. Built on a two-stage pipeline—Hunyuan3D-DiT for shape generation via flow-matching diffusion and Hunyuan3D-Paint for multi-view texture synthesis—it produces clean geometry with full PBR materials ready for game engines, AR/VR, 3D printing, and DCC tools. Available in Pro (up to 1.5M faces, 4K PBR textures) and Rapid (2–3 minute lightweight generation) tiers, with both Text-to-3D and Image-to-3D entry points, Hunyuan3D is the premier AI 3D toolkit for game developers, e-commerce teams, and 3D content studios. Generations start at $0.02 each.

Xem Dòng

Midjourney Models

Midjourney is a proprietary AI image and video generation platform developed by Midjourney, Inc. (San Francisco). Founded in 2021 by David Holz, it has become the aesthetic gold standard in generative AI — transforming text prompts into cinematic, painterly visuals at native 2K resolution. The latest V8.1 architecture, rebuilt from scratch on GPU-native PyTorch, delivers 4–5× faster generation, true 2048×2048 output without upscaling artifacts, and a signature visual style that remains unmatched by competitors. With the addition of Video V1, Midjourney extends its aesthetic into motion — animating still images into atmospheric 5-second cinematic clips. From brand campaigns to film pre-visualization to game concept art, Midjourney is the premier AI creative tool for professionals who demand both speed and artistry.

Xem Dòng

Bài viết đề xuất

Hướng dẫn, bài hướng dẫn và cập nhật sản phẩm giúp bạn khai thác tối đa Atlas Cloud.

Join our Discord community

Join the Discord community for the latest model updates, prompts, and support.