
O Atlas Cloud hospeda a linha completa do DeepSeek por meio da API do DeepSeek: V3.2, V4 e R1. Os modelos variam de 128K a 1M de contexto de tokens, todos de código aberto e com pagamento conforme o uso.
Impulsione chat, raciocínio e agentes em larga escala com os principais grandes modelos de linguagem, entregues de forma rápida e acessível na Atlas Cloud.
Compare standard vs. our pricing across every DeepSeek model.
| Model | Standard Price (USD) | Our Price (USD) | Discount | |
|---|---|---|---|---|
| DeepSeek V4 Pro | $1.74/$3.45per 1M tokens1048.6K context | $1.68/$3.38M in/outper 1M tokens1048.6K context | — | View |
| DeepSeek V4 Flash | $0.14/$0.28per 1M tokens1048.6K context | $0.14/$0.28M in/outper 1M tokens1048.6K context | — | View |
| DeepSeek V3.2 | $0.287/$0.431per 1M tokens163.8K context | $0.26/$0.38M in/outper 1M tokens163.8K context | — | View |
| DeepSeek V3.2 Exp | $0.287/$0.43per 1M tokens163.8K context | $0.27/$0.41M in/outper 1M tokens163.8K context | — | View |
| DeepSeek-V3-0324 | $0.287/$1.147per 1M tokens131.1K context | $0.216/$0.88M in/outper 1M tokens131.1K context | — | View |
| DeepSeek-R1-0528 | $0.574/$2.294per 1M tokens131.1K context | $0.55/$2.15M in/outper 1M tokens131.1K context | — | View |
Instantly explore and experiment with 300+ production-ready models in the Atlas Playground. Start customizing with one click.
Os modelos de código aberto da DeepSeek abrangem todo o espectro, desde tarefas econômicas de alto rendimento até codificação agêntica de fronteira com contexto de 1M. As equipes escolhem entre V3.2, V4 Flash e V4 Pro com base nos requisitos de contexto e na complexidade da tarefa.
As equipes de engenharia usam o DeepSeek V4 Pro para criar agentes de codificação que resolvem autonomamente problemas reais do GitHub, incluindo a leitura de descrições de problemas, o rastreamento de dependências entre arquivos, a gravação de correções e a execução de testes. O V4 Pro obtém uma pontuação de 80,6% no SWE-Bench Verified, a apenas 0,2 pontos do Claude Opus 4.6, e possui integração nativa com os frameworks de agentes Claude Code, OpenCode e OpenClaw. Mudar de um modelo de código fechado para o DeepSeek V4 no Atlas Cloud requer apenas a alteração da URL base na configuração existente do SDK.
As equipes de desenvolvimento usam a janela de contexto de 1M de tokens do DeepSeek V4 para carregar um repositório inteiro em uma única chamada de API para análise entre arquivos, rastreamento de dependências e revisão de arquitetura. O V4 atinge 97% de precisão no teste de múltiplas consultas "Needle in a Haystack" com comprimento de contexto total, o que significa que informações específicas incorporadas em qualquer lugar de um milhão de tokens são recuperadas de forma confiável. No contexto total de 1M, o V4 Pro requer apenas 27% do cálculo de inferência e 10% do cache KV que o V3.2 precisa para a mesma tarefa.
Equipes corporativas com requisitos de conformidade ou privacidade de dados usam a licença MIT da DeepSeek para auto-hospedar o V4 Flash ou V3.2 em sua própria infraestrutura. Esta é uma opção que modelos de código fechado como o GPT-5 e o Claude Opus não podem oferecer, e elimina a dependência de API para setores regulamentados. O V4 Flash, com 284 bilhões de parâmetros e 13 bilhões ativos, é o alvo prático de auto-hospedagem; o V4 Pro exige um cluster.
Equipes que migram do GPT-5 ou Claude Opus usam o DeepSeek V3.2 como um substituto direto (drop-in) por meio do endpoint compatível com OpenAI na Atlas Cloud. O V3.2 custa aproximadamente US$ 0,27 por milhão de tokens de entrada e iguala o desempenho de nível GPT-5 na maioria dos benchmarks de raciocínio. O mesmo código do SDK é direcionado para o DeepSeek com uma única alteração na URL base, tornando a migração de baixo risco.
O DeepSeek V4 é o carro-chefe da geração atual, lançado em 24 de abril de 2026, abrangendo fluxos de trabalho de propósito geral e de raciocínio em um único modelo. O R1 era um modelo de raciocínio autônomo, mas o modo de pensamento do V4 o substitui com a mesma capacidade de cadeia de pensamento embutida diretamente. O alias legado deepseek-reasoner será descontinuado em 24 de julho de 2026, portanto, novas integrações devem usar o V4 Pro com o modo de pensamento ativado.
O Engram Memory é um sistema de recuperação de conhecimento externo no DeepSeek V4, inspirado em como o hipocampo do cérebro humano armazena e recupera informações. Ele usa hash sensível à localidade para recuperar conhecimento relevante na velocidade O(1), em vez de forçar o modelo a armazenar todos os fatos em seus pesos. Isso contribuiu para que a precisão da avaliação Needle in a Haystack de múltiplas consultas do V4 saltasse de 84,2% no V3.2 para 97,0%.
Sim. DeepSeek V3.2, V4 Flash e V4 Pro são lançados sob a licença MIT, que permite uso comercial, modificação e distribuição. A auto-hospedagem do V4 Flash é prática em hardware compatível. O V4 Pro requer um cluster devido ao seu tamanho de 1,6 trilhão de parâmetros, portanto, a maioria das equipes usa o acesso à API na Atlas Cloud.
O V4 Pro é um modelo MoE de 1,6 trilhão de parâmetros com 49 bilhões de parâmetros ativos, criado para raciocínio complexo, programação e tarefas de agentes. O V4 Flash é um modelo de 284 bilhões de parâmetros com 13 bilhões ativos, otimizado em velocidade e custo-benefício para tarefas menos exigentes. Ambos compartilham a janela de contexto de 1M de tokens e a arquitetura Engram Memory.
O DeepSeek V4 suporta uma janela de contexto nativa de 1 milhão de tokens para as variantes Pro e Flash, com uma saída máxima de 393K tokens por resposta. O DeepSeek V3.2 tem uma janela de contexto de 128K. O contexto de 1M no V4 o torna prático para análise completa de base de código, processamento de documentos grandes e sessões estendidas de agentes em uma única chamada.
Sim. O DeepSeek V3.2 continua disponível na Atlas Cloud, com o preço de aproximadamente US$ 0,27 por milhão de tokens de entrada. É um modelo MoE de 685 bilhões de parâmetros com 37 bilhões de parâmetros ativos e uma janela de contexto de 128K, lançado sob a licença MIT. É uma escolha econômica para tarefas que não exigem o contexto de 1M do V4 ou o Engram Memory.
O DeepSeek V4 Pro resolve mais de 80,9% dos problemas de programação do mundo real no SWE-Bench, visando um desempenho de classe GPT-5. A precisão de contexto longo de múltiplas consultas melhorou para 97,0% no Needle in a Haystack, acima dos 84,2% da V3.2. A variante V3.2 Speciale no Atlas Cloud alcançou adicionalmente um desempenho de medalha de ouro na matemática de competição da IMO 2025 e IOI 2025.
Guias, tutoriais e novidades de produto para você aproveitar ao máximo a Atlas Cloud.
Join the Discord community for the latest model updates, prompts, and support.