
Atlas Cloud menghosting jajaran lengkap DeepSeek melalui DeepSeek API: V3.2, V4, dan R1. Model ini mendukung konteks dari 128K hingga 1M token, semuanya open-source dan berbayar sesuai penggunaan (pay-as-you-go).
Dukung chat, penalaran, dan agen dalam skala besar dengan model bahasa besar terdepan, yang disajikan cepat dan terjangkau di Atlas Cloud.
Compare standard vs. our pricing across every DeepSeek model.
| Model | Standard Price (USD) | Our Price (USD) | Discount | |
|---|---|---|---|---|
| DeepSeek V4 Pro | $1.74/$3.45per 1M tokens1048.6K context | $1.68/$3.38M in/outper 1M tokens1048.6K context | — | View |
| DeepSeek V4 Flash | $0.14/$0.28per 1M tokens1048.6K context | $0.14/$0.28M in/outper 1M tokens1048.6K context | — | View |
| DeepSeek V3.2 | $0.287/$0.431per 1M tokens163.8K context | $0.26/$0.38M in/outper 1M tokens163.8K context | — | View |
| DeepSeek V3.2 Exp | $0.287/$0.43per 1M tokens163.8K context | $0.27/$0.41M in/outper 1M tokens163.8K context | — | View |
| DeepSeek-V3-0324 | $0.287/$1.147per 1M tokens131.1K context | $0.216/$0.88M in/outper 1M tokens131.1K context | — | View |
| DeepSeek-R1-0528 | $0.574/$2.294per 1M tokens131.1K context | $0.55/$2.15M in/outper 1M tokens131.1K context | — | View |
Instantly explore and experiment with 300+ production-ready models in the Atlas Playground. Start customizing with one click.
Model open-source DeepSeek mencakup seluruh jangkauan, dari tugas throughput tinggi yang hemat biaya hingga pengkodean agensial tingkat perintis dengan konteks 1M. Tim memilih antara V3.2, V4 Flash, dan V4 Pro berdasarkan persyaratan konteks dan kompleksitas tugas.
Tim teknis menggunakan DeepSeek V4 Pro untuk membangun agen pengodean yang secara mandiri menyelesaikan masalah GitHub yang sebenarnya, termasuk membaca deskripsi masalah, melacak dependensi lintas file, menulis perbaikan, dan menjalankan pengujian. V4 Pro mencetak 80,6% pada SWE-Bench Verified, hanya terpaut 0,2 poin dari Claude Opus 4.6, dan secara bawaan terintegrasi dengan kerangka kerja agen Claude Code, OpenCode, dan OpenClaw. Beralih ke DeepSeek V4 di Atlas Cloud dari model sumber tertutup hanya memerlukan perubahan base URL dalam pengaturan SDK yang ada.
Tim pengembang menggunakan jendela konteks 1M token dari DeepSeek V4 untuk memuat seluruh repositori dalam satu panggilan API untuk analisis lintas file, pelacakan dependensi, dan tinjauan arsitektur. V4 mencapai akurasi 97% pada pengujian multi-kueri "Needle in a Haystack" pada panjang konteks penuh, yang berarti informasi spesifik yang disematkan di mana saja dalam satu juta token dapat diambil secara andal. Pada konteks 1M penuh, V4 Pro hanya membutuhkan 27% komputasi inferensi dan 10% cache KV dari yang dibutuhkan V3.2 untuk tugas yang sama.
Tim perusahaan dengan persyaratan kepatuhan atau privasi data menggunakan lisensi MIT DeepSeek untuk menyelenggarakan secara mandiri (self-host) V4 Flash atau V3.2 di infrastruktur mereka sendiri. Ini adalah pilihan yang tidak dapat ditawarkan oleh model sumber tertutup (closed-source) seperti GPT-5 dan Claude Opus, serta menghilangkan ketergantungan API untuk industri yang diatur. V4 Flash dengan 284 miliar parameter dan 13 miliar parameter aktif adalah target self-hosting yang praktis; sementara V4 Pro memerlukan klaster.
Tim yang beralih dari GPT-5 atau Claude Opus menggunakan DeepSeek V3.2 sebagai pengganti langsung (drop-in replacement) melalui endpoint yang kompatibel dengan OpenAI di Atlas Cloud. V3.2 dihargai sekitar $0,27 per juta token input sekaligus menyamai performa setingkat GPT-5 di sebagian besar benchmark penalaran. Kode SDK yang sama diarahkan ke DeepSeek dengan hanya satu perubahan URL dasar, sehingga migrasi berisiko rendah.
DeepSeek V4 adalah andalan generasi saat ini, dirilis pada 24 April 2026, mencakup alur kerja tujuan umum dan penalaran dalam satu model tunggal. R1 merupakan model penalaran mandiri, tetapi mode pemikiran V4 menggantikannya dengan kemampuan rantai pemikiran (chain-of-thought) yang sama yang dibangun secara langsung. Alias deepseek-reasoner versi lama akan dihentikan pada 24 Juli 2026, sehingga integrasi baru harus menggunakan V4 Pro dengan mode pemikiran yang diaktifkan.
Engram Memory adalah sistem pengambilan pengetahuan eksternal di DeepSeek V4, terinspirasi oleh bagaimana hipokampus otak manusia menyimpan dan mengambil informasi. Sistem ini menggunakan locality-sensitive hashing untuk mengambil pengetahuan yang relevan dengan kecepatan O(1), alih-alih memaksa model untuk menyimpan semua fakta dalam bobotnya. Hal ini berkontribusi pada lompatan akurasi multi-kueri Needle in a Haystack V4 dari 84,2% di V3.2 menjadi 97,0%.
Ya. DeepSeek V3.2, V4 Flash, dan V4 Pro semuanya dirilis di bawah lisensi MIT, yang mengizinkan penggunaan, modifikasi, dan distribusi komersial. Melakukan self-host pada V4 Flash adalah hal yang praktis pada perangkat keras yang mumpuni. V4 Pro membutuhkan klaster mengingat ukurannya yang mencapai 1,6 triliun parameter, sehingga sebagian besar tim menggunakan akses API di Atlas Cloud sebagai gantinya.
V4 Pro adalah model MoE 1,6 triliun parameter dengan 49 miliar parameter aktif, dibangun untuk penalaran kompleks, pengodean, dan tugas agen. V4 Flash adalah model 284 miliar parameter dengan 13 miliar parameter aktif, dioptimalkan untuk kecepatan dan efisiensi biaya pada tugas yang tidak terlalu menuntut. Keduanya berbagi jendela konteks 1M token dan arsitektur Engram Memory.
DeepSeek V4 mendukung jendela konteks native 1 juta token untuk varian Pro maupun Flash, dengan output maksimum 393K token per respons. DeepSeek V3.2 memiliki jendela konteks 128K. Konteks 1M pada V4 membuatnya praktis untuk analisis basis kode penuh, pemrosesan dokumen besar, dan sesi agen diperpanjang dalam satu panggilan.
Ya. DeepSeek V3.2 tetap tersedia di Atlas Cloud, dengan harga sekitar $0,27 per juta token input. Ini adalah model MoE dengan 685 miliar parameter di mana terdapat 37 miliar parameter aktif dan context window sebesar 128K, dirilis di bawah lisensi MIT. Ini merupakan pilihan yang hemat biaya untuk tugas-tugas yang tidak memerlukan konteks 1M dari V4 atau Engram Memory.
DeepSeek V4 Pro menyelesaikan lebih dari 80,9% masalah pengodean dunia nyata di SWE-Bench, menargetkan performa kelas GPT-5. Akurasi konteks panjang multikueri meningkat menjadi 97,0% pada Needle in a Haystack, naik dari 84,2% pada V3.2. Varian V3.2 Speciale di Atlas Cloud juga mencapai performa medali emas dalam matematika kompetisi IMO 2025 dan IOI 2025.
Panduan, tutorial, dan pembaruan produk untuk membantu Anda memaksimalkan Atlas Cloud.
Join the Discord community for the latest model updates, prompts, and support.