
Atlas Cloud hostet das gesamte DeepSeek-Lineup über die DeepSeek API: V3.2, V4 und R1. Die Modelle bieten einen Token-Kontext von 128K bis 1M, sind alle Open-Source und nutzen das Pay-as-you-go-Abrechnungsmodell.
Treiben Sie Chat, Reasoning und Agenten im großen Maßstab mit führenden großen Sprachmodellen an – schnell und kostengünstig bereitgestellt auf Atlas Cloud.
Compare standard vs. our pricing across every DeepSeek model.
| Model | Standard Price (USD) | Our Price (USD) | Discount | |
|---|---|---|---|---|
| DeepSeek V4 Pro | $1.74/$3.45per 1M tokens1048.6K context | $1.68/$3.38M in/outper 1M tokens1048.6K context | — | View |
| DeepSeek V4 Flash | $0.14/$0.28per 1M tokens1048.6K context | $0.14/$0.28M in/outper 1M tokens1048.6K context | — | View |
| DeepSeek V3.2 | $0.287/$0.431per 1M tokens163.8K context | $0.26/$0.38M in/outper 1M tokens163.8K context | — | View |
| DeepSeek V3.2 Exp | $0.287/$0.43per 1M tokens163.8K context | $0.27/$0.41M in/outper 1M tokens163.8K context | — | View |
| DeepSeek-V3-0324 | $0.287/$1.147per 1M tokens131.1K context | $0.216/$0.88M in/outper 1M tokens131.1K context | — | View |
| DeepSeek-R1-0528 | $0.574/$2.294per 1M tokens131.1K context | $0.55/$2.15M in/outper 1M tokens131.1K context | — | View |
Instantly explore and experiment with 300+ production-ready models in the Atlas Playground. Start customizing with one click.
Die Open-Source-Modelle von DeepSeek decken das gesamte Spektrum ab, von kosteneffizienten Aufgaben mit hohem Durchsatz bis hin zu Agenten-Programmierung auf Spitzenniveau mit 1M-Kontext. Teams wählen basierend auf den Kontextanforderungen und der Aufgabenkomplexität zwischen V3.2, V4 Flash und V4 Pro.
Engineering-Teams nutzen DeepSeek V4 Pro zur Entwicklung von Coding-Agenten, die reale GitHub-Issues autonom beheben. Dies umfasst das Lesen von Problembeschreibungen, das Verfolgen dateiübergreifender Abhängigkeiten, das Schreiben von Fixes und das Ausführen von Tests. V4 Pro erreicht einen Wert von 80,6 % bei SWE-Bench Verified, liegt damit nur 0,2 Punkte hinter Claude Opus 4.6 und ist nativ in die Agenten-Frameworks Claude Code, OpenCode und OpenClaw integriert. Der Wechsel von einem Closed-Source-Modell zu DeepSeek V4 auf der Atlas Cloud erfordert lediglich eine Änderung der Base-URL im bestehenden SDK-Setup.
Entwicklungsteams nutzen das 1M-Token-Kontextfenster von DeepSeek V4, um ein gesamtes Repository in einem einzigen API-Aufruf für dateiübergreifende Analysen, Abhängigkeitsverfolgung und Architekturüberprüfungen zu laden. V4 erreicht bei voller Kontextlänge eine Genauigkeit von 97 % beim Multi-Query-Test „Needle in a Haystack“, was bedeutet, dass spezifische Informationen, die irgendwo in einer Million Tokens eingebettet sind, zuverlässig abgerufen werden. Bei vollem 1M-Kontext benötigt V4 Pro für dieselbe Aufgabe nur 27 % der Inferenzrechenleistung und 10 % des KV-Caches, die V3.2 benötigt.
Unternehmens-Teams mit Compliance- oder Datenschutzanforderungen nutzen die MIT-Lizenz von DeepSeek, um V4 Flash oder V3.2 auf ihrer eigenen Infrastruktur selbst zu hosten. Dies ist eine Option, die Closed-Source-Modelle wie GPT-5 und Claude Opus nicht bieten können, und sie eliminiert die API-Abhängigkeit für regulierte Branchen. V4 Flash mit 284 Milliarden Parametern und 13 Milliarden aktiven Parametern ist das praktische Ziel für das Self-Hosting; V4 Pro erfordert einen Cluster.
Teams, die von GPT-5 oder Claude Opus wechseln, nutzen DeepSeek V3.2 als Drop-in-Ersatz über den OpenAI-kompatiblen Endpoint auf Atlas Cloud. V3.2 kostet etwa 0,27 $ pro Million Input-Tokens und erreicht bei den meisten Reasoning-Benchmarks eine Leistung auf GPT-5-Niveau. Der gleiche SDK-Code wird mit einer einzigen Änderung der Basis-URL zu DeepSeek geroutet, was die Migration risikoarm macht.
DeepSeek V4 ist das Flaggschiff der aktuellen Generation, das am 24. April 2026 veröffentlicht wurde und sowohl allgemeine als auch schlussfolgernde Workflows in einem einzigen Modell abdeckt. R1 war ein eigenständiges Reasoning-Modell, aber der Denkmodus von V4 ersetzt es durch die gleiche, direkt integrierte Chain-of-Thought-Fähigkeit. Der veraltete Alias deepseek-reasoner wird am 24. Juli 2026 eingestellt, sodass neue Integrationen V4 Pro mit aktiviertem Denkmodus verwenden sollten.
Engram Memory ist ein externes Wissensabrufsystem in DeepSeek V4, das davon inspiriert ist, wie der Hippocampus des menschlichen Gehirns Informationen speichert und abruft. Es verwendet lokalitätssensitives Hashing, um relevantes Wissen mit O(1)-Geschwindigkeit abzurufen, anstatt das Modell zu zwingen, alle Fakten in seinen Gewichten zu speichern. Dies trug dazu bei, dass die Genauigkeit des Multi-Query-Needle-in-a-Haystack von V4 von 84,2 % in V3.2 auf 97,0 % stieg.
Ja. DeepSeek V3.2, V4 Flash und V4 Pro werden alle unter der MIT-Lizenz veröffentlicht, die kommerzielle Nutzung, Änderung und Verbreitung erlaubt. Das Self-Hosting von V4 Flash ist auf leistungsfähiger Hardware praktikabel. V4 Pro erfordert aufgrund seiner Größe von 1,6 Billionen Parametern einen Cluster, weshalb die meisten Teams stattdessen den API-Zugang über die Atlas Cloud nutzen.
V4 Pro ist ein MoE-Modell mit 1,6 Billionen Parametern und 49 Milliarden aktiven Parametern, das für komplexes logisches Denken, Programmieren und Agenten-Aufgaben entwickelt wurde. V4 Flash ist ein Modell mit 284 Milliarden Parametern, von denen 13 Milliarden aktiv sind, optimiert für Geschwindigkeit und Kosteneffizienz bei weniger anspruchsvollen Aufgaben. Beide teilen sich das 1M-Token-Kontextfenster und die Engram Memory-Architektur.
DeepSeek V4 unterstützt ein natives Kontextfenster von 1 Million Tokens für die Varianten Pro und Flash, mit einer maximalen Ausgabe von 393K Tokens pro Antwort. DeepSeek V3.2 hat ein Kontextfenster von 128K. Der 1M-Kontext in V4 macht es praktisch für vollständige Codebase-Analysen, die Verarbeitung großer Dokumente und erweiterte agentische Sitzungen in einem einzigen Aufruf.
Ja. DeepSeek V3.2 ist weiterhin über Atlas Cloud verfügbar und kostet etwa 0,27 $ pro Million Input-Token. Es handelt sich um ein MoE-Modell mit 685 Milliarden Parametern, davon 37 Milliarden aktiven Parametern und einem 128K-Kontextfenster, das unter der MIT-Lizenz veröffentlicht wurde. Es ist eine kostengünstige Wahl für Aufgaben, die weder den 1M-Kontext von V4 noch Engram Memory benötigen.
DeepSeek V4 Pro löst über 80,9 % der realen Programmierprobleme auf SWE-Bench und zielt dabei auf Leistung auf GPT-5-Niveau ab. Die Multi-Query-Long-Context-Genauigkeit stieg bei Needle in a Haystack auf 97,0 %, verglichen mit 84,2 % in V3.2. Die V3.2 Speciale-Variante auf Atlas Cloud erzielte zusätzlich eine Leistung auf Goldmedaillen-Niveau in der Wettbewerbsmathematik der IMO 2025 und IOI 2025.
Anleitungen, Tutorials und Produkt-Updates, mit denen Sie das Beste aus Atlas Cloud herausholen.
Join the Discord community for the latest model updates, prompts, and support.