DeepSeek AI Models on AtlasCloud

Atlas Cloud lưu trữ toàn bộ chuỗi sản phẩm DeepSeek thông qua DeepSeek API: V3.2, V4 và R1. Các mô hình hỗ trợ ngữ cảnh từ 128K đến 1M token, tất cả đều là mã nguồn mở và thanh toán theo mức sử dụng (pay-as-you-go).

Large Language Models by DeepSeek

Thúc đẩy trò chuyện, suy luận và tác tử ở quy mô lớn với các mô hình ngôn ngữ lớn hàng đầu, được cung cấp nhanh chóng và tiết kiệm trên Atlas Cloud.

Xem tất cả mô hình

LLM

DeepSeek

Truy cập toàn bộ DeepSeek API trên Atlas Cloud! Một điểm cuối hợp nhất tương thích với OpenAI bao gồm mọi mô hình trong dòng sản phẩm DeepSeek. Cho dù bạn cần DeepSeek V4 API cho các khả năng suy luận tiên tiến, DeepSeek V4 Pro API cho các tác vụ ngữ cảnh dài 1 triệu token, DeepSeek V4 Flash API cho các khối lượng công việc thông lượng cao và độ trễ thấp, DeepSeek R1 API cho suy luận chuỗi suy nghĩ, hay DeepSeek V3 API và DeepSeek V3.2 API để tạo văn bản cấp độ sản xuất — chỉ một khóa API duy nhất giúp bạn truy cập ngay lập tức vào tất cả. Không cần các tài khoản riêng biệt, không có những bất ngờ về giới hạn tốc độ, chỉ thanh toán cho những gì bạn sử dụng.

7 mô hìnhKhám phá DeepSeek

DeepSeek Models API Pricing Details

Compare standard vs. our pricing across every DeepSeek model.

Model	Standard Price (USD)	Our Price (USD)	Discount
DeepSeek V4 Pro	$1.74/$3.48per 1M tokens1048.6K context	$1.68/$3.38M in/outper 1M tokens1048.6K context	—	View
DeepSeek V4 Flash	$0.14/$0.28per 1M tokens1048.6K context	$0.14/$0.28M in/outper 1M tokens1048.6K context	—	View
DeepSeek V3.2	$0.287/$0.431per 1M tokens163.8K context	$0.26/$0.38M in/outper 1M tokens163.8K context	—	View
DeepSeek V3.2 Exp	$0.287/$0.43per 1M tokens163.8K context	$0.27/$0.41M in/outper 1M tokens163.8K context	—	View
DeepSeek-V3.1	$0.574/$1.721per 1M tokens131.1K context	$0.3/$0.95M in/outper 1M tokens131.1K context	—	View
DeepSeek OCR	$0.03/$0.03per 1M tokens8.2K context	$0.04/$0.08M in/outper 1M tokens8.2K context	—	View

Explore models from other providers

Instantly explore and experiment with 400+ production-ready models in the Atlas Playground. Start customizing with one click.

xAI

Các trường hợp sử dụng API DeepSeek mà bạn có thể xây dựng trên Atlas Cloud

Các mô hình mã nguồn mở của DeepSeek bao phủ toàn bộ phạm vi từ các tác vụ thông lượng cao, tiết kiệm chi phí đến lập trình agentic tiên tiến với ngữ cảnh 1M. Các nhóm có thể lựa chọn giữa V3.2, V4 Flash và V4 Pro dựa trên các yêu cầu về ngữ cảnh và độ phức tạp của tác vụ.

Giải Quyết Issue GitHub Tự Chủ

Các nhóm kỹ thuật sử dụng DeepSeek V4 Pro để xây dựng các tác nhân lập trình tự động giải quyết các vấn đề GitHub thực tế, bao gồm việc đọc mô tả vấn đề, theo dõi các phụ thuộc chéo giữa các tệp, viết bản sửa lỗi và chạy thử nghiệm. V4 Pro đạt 80,6% trên SWE-Bench Verified, chỉ chênh lệch 0,2 điểm so với Claude Opus 4.6 và được tích hợp nguyên bản với các framework tác nhân Claude Code, OpenCode và OpenClaw. Việc chuyển đổi từ mô hình nguồn đóng sang DeepSeek V4 trên Atlas Cloud chỉ yêu cầu thay đổi URL cơ sở trong thiết lập SDK hiện tại.

Phân tích toàn bộ cơ sở mã với ngữ cảnh 1M

Các nhóm phát triển sử dụng cửa sổ ngữ cảnh 1M token của DeepSeek V4 để tải toàn bộ một kho lưu trữ trong một lệnh gọi API duy nhất cho việc phân tích chéo tệp, theo dõi phụ thuộc và đánh giá kiến trúc. V4 đạt độ chính xác 97% trong bài kiểm tra đa truy vấn "Needle in a Haystack" ở độ dài ngữ cảnh tối đa, điều này có nghĩa là các thông tin cụ thể được nhúng ở bất kỳ đâu trong một triệu token đều có thể được trích xuất một cách đáng tin cậy. Ở ngữ cảnh 1M đầy đủ, V4 Pro chỉ yêu cầu 27% tài nguyên tính toán suy luận và 10% bộ nhớ đệm KV so với V3.2 cho cùng một tác vụ.

Triển khai tự lưu trữ cho các khối lượng công việc nhạy cảm với dữ liệu

Các nhóm doanh nghiệp có yêu cầu về tuân thủ hoặc quyền riêng tư dữ liệu sử dụng giấy phép MIT của DeepSeek để tự lưu trữ V4 Flash hoặc V3.2 trên cơ sở hạ tầng của riêng họ. Đây là một tùy chọn mà các mô hình nguồn đóng như GPT-5 và Claude Opus không thể cung cấp và nó loại bỏ sự phụ thuộc vào API đối với các ngành được quản lý. V4 Flash với 284 tỷ tham số và 13 tỷ tham số hoạt động là mục tiêu tự lưu trữ thực tế; trong khi V4 Pro yêu cầu một cụm máy chủ (cluster).

Giải Pháp Thay Thế Mô Hình Đóng Tiết Kiệm Chi Phí

Các nhóm chuyển đổi từ GPT-5 hoặc Claude Opus sử dụng DeepSeek V3.2 như một giải pháp thay thế liền mạch (drop-in replacement) thông qua endpoint tương thích với OpenAI trên Atlas Cloud. V3.2 có giá khoảng 0,27 USD cho mỗi triệu token đầu vào trong khi vẫn đạt được hiệu suất ngang tầm GPT-5 trên hầu hết các benchmark suy luận. Cùng một mã SDK sẽ định tuyến đến DeepSeek chỉ với một thay đổi URL cơ sở duy nhất, giúp việc di chuyển (migration) ít rủi ro hơn.

Biến tầm nhìn doanh nghiệp của bạn thành hiện thực với Atlas Cloud AI.

Liên hệ kinh doanh

Frequently Asked Questions about DeepSeek AI Models

DeepSeek V4 là sản phẩm chủ lực thế hệ hiện tại, ra mắt ngày 24 tháng 4 năm 2026, bao gồm cả luồng công việc đa mục đích và suy luận trong một mô hình duy nhất. R1 từng là một mô hình suy luận độc lập, nhưng chế độ suy nghĩ của V4 thay thế nó bằng chính khả năng chuỗi suy nghĩ (chain-of-thought) được tích hợp trực tiếp. Bí danh deepseek-reasoner cũ sẽ ngừng hoạt động vào ngày 24 tháng 7 năm 2026, vì vậy các bản tích hợp mới nên sử dụng V4 Pro đã bật chế độ suy nghĩ.

Engram Memory là một hệ thống truy xuất kiến thức bên ngoài trong DeepSeek V4, được lấy cảm hứng từ cách hồi hải mã của não người lưu trữ và truy xuất thông tin. Nó sử dụng băm nhạy cảm cục bộ để truy xuất kiến thức liên quan với tốc độ O(1), thay vì buộc mô hình phải lưu trữ tất cả các sự kiện trong trọng số của nó. Điều này đã góp phần làm cho độ chính xác của thử nghiệm Needle in a Haystack đa truy vấn của V4 tăng vọt từ 84,2% trong V3.2 lên 97,0%.

Có. DeepSeek V3.2, V4 Flash và V4 Pro đều được phát hành theo giấy phép MIT, cho phép sử dụng, sửa đổi và phân phối với mục đích thương mại. Việc tự lưu trữ (self-host) V4 Flash rất khả thi trên phần cứng có đủ khả năng. V4 Pro yêu cầu một cụm máy chủ (cluster) vì có kích thước lên tới 1,6 nghìn tỷ tham số, do đó hầu hết các nhóm sử dụng quyền truy cập API trên Atlas Cloud để thay thế.

V4 Pro là một mô hình MoE với 1,6 nghìn tỷ tham số và 49 tỷ tham số hoạt động, được xây dựng cho các tác vụ suy luận phức tạp, lập trình và tác tử. V4 Flash là một mô hình có 284 tỷ tham số với 13 tỷ tham số hoạt động, được tối ưu hóa về tốc độ và hiệu quả chi phí cho các tác vụ ít đòi hỏi hơn. Cả hai đều chia sẻ cửa sổ ngữ cảnh 1M token và kiến trúc Engram Memory.

DeepSeek V4 hỗ trợ cửa sổ ngữ cảnh nguyên bản 1 triệu token cho cả hai biến thể Pro và Flash, với đầu ra tối đa là 393K token mỗi phản hồi. DeepSeek V3.2 có cửa sổ ngữ cảnh 128K. Ngữ cảnh 1M trong V4 làm cho nó trở nên thiết thực cho việc phân tích toàn bộ cơ sở mã, xử lý tài liệu lớn và các phiên tác nhân mở rộng chỉ trong một lệnh gọi duy nhất.

Có. DeepSeek V3.2 vẫn được cung cấp trên Atlas Cloud, với mức giá khoảng 0,27 đô la cho mỗi triệu token đầu vào. Đây là mô hình MoE có 685 tỷ tham số với 37 tỷ tham số hoạt động và cửa sổ ngữ cảnh 128K, được phát hành theo giấy phép MIT. Đây là một lựa chọn tiết kiệm chi phí cho các tác vụ không yêu cầu ngữ cảnh 1M của V4 hoặc Engram Memory.

DeepSeek V4 Pro giải quyết hơn 80,9% các vấn đề lập trình trong thế giới thực trên SWE-Bench, nhắm đến hiệu suất cấp độ GPT-5. Độ chính xác ngữ cảnh dài đa truy vấn đã tăng lên 97,0% trên Needle in a Haystack, so với 84,2% ở phiên bản V3.2. Biến thể V3.2 Speciale trên Atlas Cloud cũng đã đạt được hiệu suất huy chương vàng trong toán học cạnh tranh IMO 2025 và IOI 2025.

Khám phá Thêm Dòng

Seedance 2.0

Seedance 2.0 API cung cấp cho bạn quyền truy cập cấp sản xuất vào mô hình video đa phương thức của ByteDance — đầu vào bốn phương thức (văn bản, hình ảnh, video, âm thanh) và hệ thống "Universal Reference" hàng đầu trong ngành giúp khóa bố cục, chuyển động của camera và hành động của nhân vật trên các cảnh quay. Tích hợp quyền kiểm soát cấp độ đạo diễn bằng một lệnh gọi API, mức giá cố định $0,09/giây, cấp khóa tức thì và không có danh sách chờ — được hỗ trợ bởi thời gian hoạt động và sự tuân thủ cấp doanh nghiệp. Seedance 2.0 Native 4K hiện đã ra mắt!

Xem Dòng

Grok Imagine

Grok Imagine API cung cấp cho các nhà phát triển khả năng tạo hình ảnh, video và âm thanh của xAI trong một bộ công cụ duy nhất. API này tạo ra hình ảnh độ phân giải lên đến 2K với khả năng hiển thị văn bản đa ngôn ngữ, cộng với video lên đến 15 giây với âm thanh gốc, được đồng bộ hóa và chỉnh sửa dựa trên tham chiếu. Trên Atlas Cloud, một khóa duy nhất có thể chạy mọi chế độ Grok Imagine, do đó bạn có thể chuyển đổi giữa hình ảnh, video và âm thanh mà không cần thiết lập riêng biệt, với mức giá từ 0,02 USD cho mỗi hình ảnh và 0,05 USD mỗi giây.

Xem Dòng

Gemini Omni Flash

Gemini Omni API đưa mô hình tạo và chỉnh sửa video đa phương thức của Google DeepMind, được giới thiệu tại Google I/O 2026, vào stack của bạn. Gemini Omni kết hợp công cụ suy luận của Gemini với media tạo sinh, chấp nhận mọi tổ hợp văn bản, hình ảnh, video và âm thanh để tạo ra kết quả nhất quán, dựa trên nền tảng tri thức. Tinh chỉnh kết quả qua hội thoại tự nhiên — hoán đổi vật thể, viết lại cảnh quay và thay đổi phong cách, trong khi vật lý, nhân vật và tính liên tục vẫn được giữ nguyên. Atlas Cloud cung cấp trọn bộ dòng Gemini Omni Flash — chuyển văn bản thành video, chuyển hình ảnh thành video với tối đa 7 hình ảnh tham chiếu, và chuyển tham chiếu thành video — thông qua một API hợp nhất với mức giá minh bạch tính theo giây từ $0.112 và không cần đăng ký thuê bao. Bắt đầu xây dựng ngay hôm nay.

Xem Dòng

GPT Image 2

GPT Image 2 API cung cấp cho các nhà phát triển quyền truy cập vào mô hình hình ảnh mới nhất của OpenAI, phiên bản kế nhiệm của GPT Image 1.5. Mô hình này tạo và chỉnh sửa hình ảnh với khả năng hiển thị văn bản chính xác trên các chữ viết Latinh và CJK, cùng với bố cục mạnh mẽ cho áp phích, mockup và đồ họa thông tin. Trên Atlas Cloud, bạn có thể truy cập nó thông qua một API thống nhất cùng với hơn 300 mô hình khác, với tín dụng miễn phí, 99,99% thời gian hoạt động và không yêu cầu xác minh tổ chức OpenAI.

Xem Dòng

Google

Các mô hình sáng tạo mạnh mẽ nhất của Google hiện đều có sẵn trên Atlas Cloud. Veo 3.1 cung cấp khả năng tạo video đậm chất điện ảnh, Nano Banana 2 hỗ trợ tạo hình ảnh có độ chân thực cao, và Gemini mang trí tuệ đa phương thức vào mọi quy trình làm việc. Truy cập toàn bộ bộ mô hình Google thông qua một API key duy nhất với tính khả dụng Day-0 và mức giá dùng bao nhiêu trả bấy nhiêu (pay-as-you-go).

Xem Dòng

Seedance 2.0 Mini

Seedance 2.0 Mini mang khả năng tạo video đa phương thức của ByteDance vào các quy trình làm việc nơi tốc độ và chi phí là quan trọng nhất. Nó cung cấp các khả năng cốt lõi của Seedance 2.0 với mức tiêu thụ tài nguyên nhẹ hơn — tạo nhanh hơn, chi phí mỗi video thấp hơn và tích hợp API giống như bạn đã sử dụng. Đối với các nhóm chạy các quy trình (pipeline) khối lượng lớn hoặc tạo nguyên mẫu ở quy mô lớn, Mini là lựa chọn mặc định thiết thực.

Xem Dòng

ByteDance

Từ tạo video điện ảnh đến kiến tạo hình ảnh có độ trung thực cao, các mô hình mạnh mẽ nhất của ByteDance hiện đã có mặt trên Atlas Cloud. Chạy Seedance và Seedream ở quy mô lớn với mức giá suy luận thấp nhất và không có chi phí quản lý cơ sở hạ tầng.

Xem Dòng

Alibaba

Atlas Cloud tập hợp toàn bộ dòng mô hình của Alibaba dưới một API duy nhất: Qwen cho các tác vụ ngôn ngữ và hình ảnh, Wan để tạo video với độ phân giải lên đến 1080p. Truy cập mọi mô hình theo hình thức dùng đến đâu trả tiền đến đó (pay-as-you-go) mà không cần đăng ký gói. Alibaba API có sẵn thông qua một URL cơ sở (base URL) duy nhất bằng cách sử dụng ứng dụng khách tương thích với OpenAI hiện có của bạn.

Xem Dòng

OpenAI

Atlas Cloud cấp cho bạn quyền truy cập vào toàn bộ danh mục OpenAI API, từ GPT Image 2 để tạo hình ảnh đến Sora 2 cho video. Mọi mô hình đều có sẵn theo hình thức dùng đến đâu trả tiền đến đó (pay-as-you-go) mà không cần cam kết hàng tháng. Tích hợp dễ dàng chỉ bằng cách thay đổi một base URL thông qua API tương thích với OpenAI.

Xem Dòng

xAI

Xây dựng các pipeline hình ảnh và video hoàn chỉnh bằng xAI API trên Atlas Cloud. Tạo ở độ phân giải 2K, chỉnh sửa bằng hình ảnh tham chiếu và tạo hoạt ảnh từ hình ảnh thành các clip đồng bộ với âm thanh.

Xem Dòng

Kwaivgi

Kwaivgi API với mức giá thấp hơn 15% so với giá tiêu chuẩn. Atlas Cloud cung cấp quyền truy cập Day-0 cho các bản phát hành Kling mới với mức giá dùng trả theo mức sử dụng (pay-as-you-go) và không giới hạn số lượng người dùng. Một tài khoản, một khóa, mọi mô hình Kling từ cấp tiêu chuẩn đến cấp master.

Xem Dòng

Seedream 5.0 Pro

Seedream 5.0 Pro API cung cấp cho các nhà phát triển mô hình chỉnh sửa hình ảnh có thể kiểm soát của ByteDance trên Atlas Cloud. Nó đặt các chỉnh sửa một cách chính xác bằng các điểm neo và tọa độ, tách hình ảnh thành các lớp có thể chỉnh sửa, kết hợp nhiều tham chiếu và khớp màu sắc cũng như vật liệu chính xác, với văn bản đa ngôn ngữ ở độ phân giải 2K và 3K. Trên Atlas Cloud, bạn có thể truy cập nó chỉ bằng một khóa!

Xem Dòng

Bài viết đề xuất

Hướng dẫn, bài hướng dẫn và cập nhật sản phẩm giúp bạn khai thác tối đa Atlas Cloud.

DeepSeek v4: Everything We Know So Far – Features, Release Date, and How to Access on Atlas Cloud

DeepSeek AI Models on AtlasCloud

Large Language Models by DeepSeek

DeepSeek

DeepSeek Models API Pricing Details

Explore models from other providers

Các trường hợp sử dụng API DeepSeek mà bạn có thể xây dựng trên Atlas Cloud

Giải Quyết Issue GitHub Tự Chủ

Phân tích toàn bộ cơ sở mã với ngữ cảnh 1M

Triển khai tự lưu trữ cho các khối lượng công việc nhạy cảm với dữ liệu

Giải Pháp Thay Thế Mô Hình Đóng Tiết Kiệm Chi Phí

Biến tầm nhìn doanh nghiệp của bạn thành hiện thực với Atlas Cloud AI.

Frequently Asked Questions about DeepSeek AI Models

Khám phá Thêm Dòng

Seedance 2.0

Grok Imagine

Gemini Omni Flash

GPT Image 2

Google

Seedance 2.0 Mini

ByteDance

Alibaba

OpenAI

xAI

Kwaivgi

Seedream 5.0 Pro

Bài viết đề xuất

DeepSeek v4: Everything We Know So Far – Features, Release Date, and How to Access on Atlas Cloud

DeepSeek, Kimi, GLM, MiniMax, Qwen: The Best Open Source Coding LLMs Ranked for 2026

DeepSeek V4 Pro vs. Opus 4.7: Is the Price Gap Worth the Performance Trade-Off?

Which OpenAI-compatible API provider supports DeepSeek, Qwen, Kimi, MiniMax, and GLM?

Stop Juggling API Keys: Access DeepSeek, GLM, and Kimi Through a Unified LLM API Gateway