
Atlas Cloud ospita l'intera gamma DeepSeek tramite l'API DeepSeek: V3.2, V4 e R1. I modelli offrono un contesto che va da 128K a 1M di token, sono tutti open-source e con fatturazione a consumo (pay-as-you-go).
Alimenta chat, ragionamento e agenti su larga scala con i migliori modelli linguistici di grandi dimensioni, erogati in modo rapido ed economico su Atlas Cloud.
Compare standard vs. our pricing across every DeepSeek model.
| Model | Standard Price (USD) | Our Price (USD) | Discount | |
|---|---|---|---|---|
| DeepSeek V4 Pro | $1.74/$3.45per 1M tokens1048.6K context | $1.68/$3.38M in/outper 1M tokens1048.6K context | — | View |
| DeepSeek V4 Flash | $0.14/$0.28per 1M tokens1048.6K context | $0.14/$0.28M in/outper 1M tokens1048.6K context | — | View |
| DeepSeek V3.2 | $0.287/$0.431per 1M tokens163.8K context | $0.26/$0.38M in/outper 1M tokens163.8K context | — | View |
| DeepSeek V3.2 Exp | $0.287/$0.43per 1M tokens163.8K context | $0.27/$0.41M in/outper 1M tokens163.8K context | — | View |
| DeepSeek-V3-0324 | $0.287/$1.147per 1M tokens131.1K context | $0.216/$0.88M in/outper 1M tokens131.1K context | — | View |
| DeepSeek-R1-0528 | $0.574/$2.294per 1M tokens131.1K context | $0.55/$2.15M in/outper 1M tokens131.1K context | — | View |
Instantly explore and experiment with 300+ production-ready models in the Atlas Playground. Start customizing with one click.
I modelli open source di DeepSeek coprono l'intero spettro, dalle attività ad alto rendimento ed economicamente vantaggiose alla programmazione agentica di frontiera con un contesto da 1M. I team scelgono tra V3.2, V4 Flash e V4 Pro in base ai requisiti di contesto e alla complessità dell'attività.
I team di ingegneria utilizzano DeepSeek V4 Pro per creare agenti di codifica che risolvono in modo autonomo problemi reali di GitHub, tra cui la lettura delle descrizioni dei problemi, il tracciamento delle dipendenze tra file, la scrittura di correzioni e l'esecuzione di test. V4 Pro ottiene un punteggio dell'80,6% su SWE-Bench Verified, a soli 0,2 punti da Claude Opus 4.6, ed è integrato nativamente con i framework di agenti Claude Code, OpenCode e OpenClaw. Passare a DeepSeek V4 su Atlas Cloud da un modello closed-source richiede solo una modifica dell'URL di base nella configurazione dell'SDK esistente.
I team di sviluppo utilizzano la finestra di contesto da 1M di token di DeepSeek V4 per caricare un intero repository in una singola chiamata API per l'analisi incrociata dei file, il tracciamento delle dipendenze e la revisione dell'architettura. V4 raggiunge il 97% di precisione nel test multi-query "Needle in a Haystack" all'intera lunghezza del contesto, il che significa che le informazioni specifiche incorporate ovunque in un milione di token vengono recuperate in modo affidabile. Con un contesto completo di 1M, V4 Pro richiede solo il 27% dell'elaborazione di inferenza e il 10% della cache KV di cui V3.2 ha bisogno per la stessa attività.
I team aziendali con requisiti di conformità o privacy dei dati utilizzano la licenza MIT di DeepSeek per ospitare autonomamente V4 Flash o V3.2 sulla propria infrastruttura. Questa è un'opzione che i modelli closed-source come GPT-5 e Claude Opus non possono offrire e che elimina la dipendenza dalle API per i settori regolamentati. V4 Flash, con 284 miliardi di parametri e 13 miliardi attivi, è il pratico obiettivo per il self-hosting; V4 Pro richiede un cluster.
I team che passano da GPT-5 o Claude Opus utilizzano DeepSeek V3.2 come sostituto drop-in tramite l'endpoint compatibile con OpenAI su Atlas Cloud. V3.2 ha un prezzo di circa $ 0,27 per milione di token di input, eguagliando le prestazioni a livello di GPT-5 nella maggior parte dei benchmark di ragionamento. Lo stesso codice SDK viene indirizzato a DeepSeek con una singola modifica dell'URL di base, rendendo la migrazione a basso rischio.
DeepSeek V4 è l'ammiraglia della generazione attuale, rilasciata il 24 aprile 2026, che copre sia i flussi di lavoro generici che di ragionamento in un unico modello. R1 era un modello di ragionamento autonomo, ma la modalità di pensiero di V4 lo sostituisce con la stessa capacità di catena di pensieri (chain-of-thought) integrata direttamente. L'alias legacy deepseek-reasoner verrà ritirato il 24 luglio 2026, quindi le nuove integrazioni dovrebbero utilizzare V4 Pro con la modalità di pensiero abilitata.
Engram Memory è un sistema di recupero della conoscenza esterno in DeepSeek V4, ispirato al modo in cui l'ippocampo del cervello umano archivia e recupera le informazioni. Utilizza l'hashing sensibile alla località per recuperare la conoscenza pertinente a velocità O(1), anziché forzare il modello a memorizzare tutti i fatti nei suoi pesi. Ciò ha contribuito a far balzare la precisione del test Needle in a Haystack multi-query di V4 dall'84,2% di V3.2 al 97,0%.
Sì. DeepSeek V3.2, V4 Flash e V4 Pro sono tutti rilasciati con licenza MIT, che ne consente l'uso commerciale, la modifica e la distribuzione. L'hosting autonomo di V4 Flash è pratico su hardware adeguato. V4 Pro richiede un cluster a causa delle sue dimensioni di 1,6 bilioni di parametri, per cui la maggior parte dei team utilizza invece l'accesso API su Atlas Cloud.
V4 Pro è un modello MoE da 1,6 bilioni di parametri con 49 miliardi di parametri attivi, progettato per ragionamenti complessi, programmazione e compiti agenziali. V4 Flash è un modello da 284 miliardi di parametri di cui 13 miliardi attivi, ottimizzato per velocità e convenienza economica su compiti meno impegnativi. Entrambi condividono la finestra di contesto da 1M di token e l'architettura Engram Memory.
DeepSeek V4 supporta una finestra di contesto nativa di 1 milione di token per le varianti Pro e Flash, con un output massimo di 393K token per risposta. DeepSeek V3.2 ha una finestra di contesto di 128K. Il contesto di 1M nella V4 lo rende pratico per l'analisi completa della codebase, l'elaborazione di documenti di grandi dimensioni e sessioni agentiche estese in una singola chiamata.
Sì. DeepSeek V3.2 rimane disponibile su Atlas Cloud, a un prezzo di circa 0,27 $ per milione di token di input. È un modello MoE da 685 miliardi di parametri, con 37 miliardi di parametri attivi e una finestra di contesto da 128K, rilasciato con licenza MIT. È una scelta conveniente per le attività che non richiedono il contesto da 1M di V4 o la Engram Memory.
DeepSeek V4 Pro risolve oltre l'80,9% dei problemi di programmazione del mondo reale su SWE-Bench, puntando a prestazioni di classe GPT-5. L'accuratezza del contesto lungo multi-query è migliorata al 97,0% su Needle in a Haystack, rispetto all'84,2% della V3.2. La variante V3.2 Speciale su Atlas Cloud ha inoltre ottenuto prestazioni da medaglia d'oro nella matematica da competizione delle IMO 2025 e IOI 2025.
Guide, tutorial e novità di prodotto per sfruttare al meglio Atlas Cloud.
Join the Discord community for the latest model updates, prompts, and support.