
Atlas Cloud lưu trữ toàn bộ chuỗi sản phẩm DeepSeek thông qua DeepSeek API: V3.2, V4 và R1. Các mô hình hỗ trợ ngữ cảnh từ 128K đến 1M token, tất cả đều là mã nguồn mở và thanh toán theo mức sử dụng (pay-as-you-go).
Thúc đẩy trò chuyện, suy luận và tác tử ở quy mô lớn với các mô hình ngôn ngữ lớn hàng đầu, được cung cấp nhanh chóng và tiết kiệm trên Atlas Cloud.
Compare standard vs. our pricing across every DeepSeek model.
| Model | Standard Price (USD) | Our Price (USD) | Discount | |
|---|---|---|---|---|
| DeepSeek V4 Pro | $1.74/$3.45per 1M tokens1048.6K context | $1.68/$3.38M in/outper 1M tokens1048.6K context | — | View |
| DeepSeek V4 Flash | $0.14/$0.28per 1M tokens1048.6K context | $0.14/$0.28M in/outper 1M tokens1048.6K context | — | View |
| DeepSeek V3.2 | $0.287/$0.431per 1M tokens163.8K context | $0.26/$0.38M in/outper 1M tokens163.8K context | — | View |
| DeepSeek V3.2 Exp | $0.287/$0.43per 1M tokens163.8K context | $0.27/$0.41M in/outper 1M tokens163.8K context | — | View |
| DeepSeek-V3-0324 | $0.287/$1.147per 1M tokens131.1K context | $0.216/$0.88M in/outper 1M tokens131.1K context | — | View |
| DeepSeek-R1-0528 | $0.574/$2.294per 1M tokens131.1K context | $0.55/$2.15M in/outper 1M tokens131.1K context | — | View |
Instantly explore and experiment with 300+ production-ready models in the Atlas Playground. Start customizing with one click.
Các mô hình mã nguồn mở của DeepSeek bao phủ toàn bộ phạm vi từ các tác vụ thông lượng cao, tiết kiệm chi phí đến lập trình agentic tiên tiến với ngữ cảnh 1M. Các nhóm có thể lựa chọn giữa V3.2, V4 Flash và V4 Pro dựa trên các yêu cầu về ngữ cảnh và độ phức tạp của tác vụ.
Các nhóm kỹ thuật sử dụng DeepSeek V4 Pro để xây dựng các tác nhân lập trình tự động giải quyết các vấn đề GitHub thực tế, bao gồm việc đọc mô tả vấn đề, theo dõi các phụ thuộc chéo giữa các tệp, viết bản sửa lỗi và chạy thử nghiệm. V4 Pro đạt 80,6% trên SWE-Bench Verified, chỉ chênh lệch 0,2 điểm so với Claude Opus 4.6 và được tích hợp nguyên bản với các framework tác nhân Claude Code, OpenCode và OpenClaw. Việc chuyển đổi từ mô hình nguồn đóng sang DeepSeek V4 trên Atlas Cloud chỉ yêu cầu thay đổi URL cơ sở trong thiết lập SDK hiện tại.
Các nhóm phát triển sử dụng cửa sổ ngữ cảnh 1M token của DeepSeek V4 để tải toàn bộ một kho lưu trữ trong một lệnh gọi API duy nhất cho việc phân tích chéo tệp, theo dõi phụ thuộc và đánh giá kiến trúc. V4 đạt độ chính xác 97% trong bài kiểm tra đa truy vấn "Needle in a Haystack" ở độ dài ngữ cảnh tối đa, điều này có nghĩa là các thông tin cụ thể được nhúng ở bất kỳ đâu trong một triệu token đều có thể được trích xuất một cách đáng tin cậy. Ở ngữ cảnh 1M đầy đủ, V4 Pro chỉ yêu cầu 27% tài nguyên tính toán suy luận và 10% bộ nhớ đệm KV so với V3.2 cho cùng một tác vụ.
Các nhóm doanh nghiệp có yêu cầu về tuân thủ hoặc quyền riêng tư dữ liệu sử dụng giấy phép MIT của DeepSeek để tự lưu trữ V4 Flash hoặc V3.2 trên cơ sở hạ tầng của riêng họ. Đây là một tùy chọn mà các mô hình nguồn đóng như GPT-5 và Claude Opus không thể cung cấp và nó loại bỏ sự phụ thuộc vào API đối với các ngành được quản lý. V4 Flash với 284 tỷ tham số và 13 tỷ tham số hoạt động là mục tiêu tự lưu trữ thực tế; trong khi V4 Pro yêu cầu một cụm máy chủ (cluster).
Các nhóm chuyển đổi từ GPT-5 hoặc Claude Opus sử dụng DeepSeek V3.2 như một giải pháp thay thế liền mạch (drop-in replacement) thông qua endpoint tương thích với OpenAI trên Atlas Cloud. V3.2 có giá khoảng 0,27 USD cho mỗi triệu token đầu vào trong khi vẫn đạt được hiệu suất ngang tầm GPT-5 trên hầu hết các benchmark suy luận. Cùng một mã SDK sẽ định tuyến đến DeepSeek chỉ với một thay đổi URL cơ sở duy nhất, giúp việc di chuyển (migration) ít rủi ro hơn.
DeepSeek V4 là sản phẩm chủ lực thế hệ hiện tại, ra mắt ngày 24 tháng 4 năm 2026, bao gồm cả luồng công việc đa mục đích và suy luận trong một mô hình duy nhất. R1 từng là một mô hình suy luận độc lập, nhưng chế độ suy nghĩ của V4 thay thế nó bằng chính khả năng chuỗi suy nghĩ (chain-of-thought) được tích hợp trực tiếp. Bí danh deepseek-reasoner cũ sẽ ngừng hoạt động vào ngày 24 tháng 7 năm 2026, vì vậy các bản tích hợp mới nên sử dụng V4 Pro đã bật chế độ suy nghĩ.
Engram Memory là một hệ thống truy xuất kiến thức bên ngoài trong DeepSeek V4, được lấy cảm hứng từ cách hồi hải mã của não người lưu trữ và truy xuất thông tin. Nó sử dụng băm nhạy cảm cục bộ để truy xuất kiến thức liên quan với tốc độ O(1), thay vì buộc mô hình phải lưu trữ tất cả các sự kiện trong trọng số của nó. Điều này đã góp phần làm cho độ chính xác của thử nghiệm Needle in a Haystack đa truy vấn của V4 tăng vọt từ 84,2% trong V3.2 lên 97,0%.
Có. DeepSeek V3.2, V4 Flash và V4 Pro đều được phát hành theo giấy phép MIT, cho phép sử dụng, sửa đổi và phân phối với mục đích thương mại. Việc tự lưu trữ (self-host) V4 Flash rất khả thi trên phần cứng có đủ khả năng. V4 Pro yêu cầu một cụm máy chủ (cluster) vì có kích thước lên tới 1,6 nghìn tỷ tham số, do đó hầu hết các nhóm sử dụng quyền truy cập API trên Atlas Cloud để thay thế.
V4 Pro là một mô hình MoE với 1,6 nghìn tỷ tham số và 49 tỷ tham số hoạt động, được xây dựng cho các tác vụ suy luận phức tạp, lập trình và tác tử. V4 Flash là một mô hình có 284 tỷ tham số với 13 tỷ tham số hoạt động, được tối ưu hóa về tốc độ và hiệu quả chi phí cho các tác vụ ít đòi hỏi hơn. Cả hai đều chia sẻ cửa sổ ngữ cảnh 1M token và kiến trúc Engram Memory.
DeepSeek V4 hỗ trợ cửa sổ ngữ cảnh nguyên bản 1 triệu token cho cả hai biến thể Pro và Flash, với đầu ra tối đa là 393K token mỗi phản hồi. DeepSeek V3.2 có cửa sổ ngữ cảnh 128K. Ngữ cảnh 1M trong V4 làm cho nó trở nên thiết thực cho việc phân tích toàn bộ cơ sở mã, xử lý tài liệu lớn và các phiên tác nhân mở rộng chỉ trong một lệnh gọi duy nhất.
Có. DeepSeek V3.2 vẫn được cung cấp trên Atlas Cloud, với mức giá khoảng 0,27 đô la cho mỗi triệu token đầu vào. Đây là mô hình MoE có 685 tỷ tham số với 37 tỷ tham số hoạt động và cửa sổ ngữ cảnh 128K, được phát hành theo giấy phép MIT. Đây là một lựa chọn tiết kiệm chi phí cho các tác vụ không yêu cầu ngữ cảnh 1M của V4 hoặc Engram Memory.
DeepSeek V4 Pro giải quyết hơn 80,9% các vấn đề lập trình trong thế giới thực trên SWE-Bench, nhắm đến hiệu suất cấp độ GPT-5. Độ chính xác ngữ cảnh dài đa truy vấn đã tăng lên 97,0% trên Needle in a Haystack, so với 84,2% ở phiên bản V3.2. Biến thể V3.2 Speciale trên Atlas Cloud cũng đã đạt được hiệu suất huy chương vàng trong toán học cạnh tranh IMO 2025 và IOI 2025.
Hướng dẫn, bài hướng dẫn và cập nhật sản phẩm giúp bạn khai thác tối đa Atlas Cloud.
Join the Discord community for the latest model updates, prompts, and support.