
Atlas Cloud aloja la línea completa de DeepSeek a través de la API de DeepSeek: V3.2, V4 y R1. Los modelos abarcan desde 128K hasta 1M de contexto de tokens, todos de código abierto y con pago por uso.
Impulsa chat, razonamiento y agentes a gran escala con los principales grandes modelos de lenguaje, servidos de forma rápida y asequible en Atlas Cloud.
Compare standard vs. our pricing across every DeepSeek model.
| Model | Standard Price (USD) | Our Price (USD) | Discount | |
|---|---|---|---|---|
| DeepSeek V4 Pro | $1.74/$3.45per 1M tokens1048.6K context | $1.68/$3.38M in/outper 1M tokens1048.6K context | — | View |
| DeepSeek V4 Flash | $0.14/$0.28per 1M tokens1048.6K context | $0.14/$0.28M in/outper 1M tokens1048.6K context | — | View |
| DeepSeek V3.2 | $0.287/$0.431per 1M tokens163.8K context | $0.26/$0.38M in/outper 1M tokens163.8K context | — | View |
| DeepSeek V3.2 Exp | $0.287/$0.43per 1M tokens163.8K context | $0.27/$0.41M in/outper 1M tokens163.8K context | — | View |
| DeepSeek-V3-0324 | $0.287/$1.147per 1M tokens131.1K context | $0.216/$0.88M in/outper 1M tokens131.1K context | — | View |
| DeepSeek-R1-0528 | $0.574/$2.294per 1M tokens131.1K context | $0.55/$2.15M in/outper 1M tokens131.1K context | — | View |
Instantly explore and experiment with 300+ production-ready models in the Atlas Playground. Start customizing with one click.
Los modelos de código abierto de DeepSeek cubren todo el espectro, desde tareas rentables de alto rendimiento hasta la programación agéntica de vanguardia con un contexto de 1M. Los equipos eligen entre V3.2, V4 Flash y V4 Pro según los requisitos de contexto y la complejidad de la tarea.
Los equipos de ingeniería utilizan DeepSeek V4 Pro para crear agentes de programación que resuelven de forma autónoma problemas reales de GitHub, lo que incluye leer las descripciones de los problemas, rastrear las dependencias entre archivos, escribir correcciones y ejecutar pruebas. V4 Pro obtiene una puntuación del 80,6 % en SWE-Bench Verified, a solo 0,2 puntos de Claude Opus 4.6, y está integrado de forma nativa con los marcos de agentes de Claude Code, OpenCode y OpenClaw. Cambiar a DeepSeek V4 en Atlas Cloud desde un modelo de código cerrado requiere solo un cambio de la URL base en la configuración del SDK existente.
Los equipos de desarrollo utilizan la ventana de contexto de 1M de tokens de DeepSeek V4 para cargar un repositorio completo en una sola llamada a la API para el análisis de múltiples archivos, el rastreo de dependencias y la revisión de la arquitectura. V4 alcanza una precisión del 97% en la prueba de múltiples consultas "Needle in a Haystack" con la longitud de contexto completa, lo que significa que la información específica integrada en cualquier lugar de un millón de tokens se recupera de manera confiable. Con un contexto completo de 1M, V4 Pro requiere solo el 27% del cálculo de inferencia y el 10% del caché KV que necesita V3.2 para la misma tarea.
Los equipos empresariales con requisitos de cumplimiento o privacidad de datos utilizan la licencia MIT de DeepSeek para autoalojar V4 Flash o V3.2 en su propia infraestructura. Esta es una opción que los modelos de código cerrado como GPT-5 y Claude Opus no pueden ofrecer, y elimina la dependencia de la API para las industrias reguladas. V4 Flash, con 284 mil millones de parámetros y 13 mil millones activos, es el objetivo práctico de autoalojamiento; V4 Pro requiere un clúster.
Los equipos que cambian de GPT-5 o Claude Opus utilizan DeepSeek V3.2 como reemplazo directo a través del endpoint compatible con OpenAI en Atlas Cloud. V3.2 tiene un precio de aproximadamente 0,27 $ por millón de tokens de entrada, a la vez que iguala el rendimiento de nivel GPT-5 en la mayoría de los benchmarks de razonamiento. El mismo código del SDK se dirige a DeepSeek con un solo cambio de URL base, lo que hace que la migración sea de bajo riesgo.
DeepSeek V4 es el buque insignia de la generación actual, lanzado el 24 de abril de 2026, que cubre tanto los flujos de trabajo de propósito general como de razonamiento en un solo modelo. R1 era un modelo de razonamiento independiente, pero el modo de pensamiento de V4 lo reemplaza con la misma capacidad de cadena de pensamiento integrada directamente. El alias heredado deepseek-reasoner se retira el 24 de julio de 2026, por lo que las nuevas integraciones deben utilizar V4 Pro con el modo de pensamiento habilitado.
Engram Memory es un sistema de recuperación de conocimiento externo en DeepSeek V4, inspirado en cómo el hipocampo del cerebro humano almacena y recupera información. Utiliza hash sensible a la localidad para recuperar conocimiento relevante a velocidad O(1), en lugar de forzar al modelo a almacenar todos los hechos en sus pesos. Esto contribuyó a que la precisión de Needle in a Haystack de múltiples consultas de V4 saltara del 84,2 % en V3.2 al 97,0 %.
Sí. DeepSeek V3.2, V4 Flash y V4 Pro se publican bajo la licencia MIT, que permite su uso comercial, modificación y distribución. El autoalojamiento de V4 Flash es práctico en hardware capaz. V4 Pro requiere un clúster dado su tamaño de 1,6 billones de parámetros, por lo que la mayoría de los equipos utilizan en su lugar el acceso a la API en Atlas Cloud.
V4 Pro es un modelo MoE de 1,6 billones de parámetros con 49 mil millones de parámetros activos, diseñado para tareas de razonamiento complejo, programación y agentes. V4 Flash es un modelo de 284 mil millones de parámetros con 13 mil millones activos, optimizado para la velocidad y la rentabilidad en tareas menos exigentes. Ambos comparten la ventana de contexto de 1M de tokens y la arquitectura Engram Memory.
DeepSeek V4 soporta una ventana de contexto nativa de 1 millón de tokens tanto para las variantes Pro como Flash, con una salida máxima de 393K tokens por respuesta. DeepSeek V3.2 tiene una ventana de contexto de 128K. El contexto de 1M en la V4 lo hace práctico para el análisis completo de bases de código, el procesamiento de documentos grandes y las sesiones extendidas de agentes en una sola llamada.
Sí. DeepSeek V3.2 sigue disponible en Atlas Cloud, a un precio de aproximadamente 0,27 $ por millón de tokens de entrada. Es un modelo MoE de 685 mil millones de parámetros con 37 mil millones de parámetros activos y una ventana de contexto de 128K, publicado bajo la licencia MIT. Es una opción rentable para tareas que no requieren el contexto de 1M de V4 ni Engram Memory.
DeepSeek V4 Pro resuelve más del 80,9 % de los problemas de programación del mundo real en SWE-Bench, apuntando a un rendimiento de clase GPT-5. La precisión de contexto largo de múltiples consultas mejoró al 97,0 % en Needle in a Haystack, frente al 84,2 % en la versión V3.2. Además, la variante V3.2 Speciale en Atlas Cloud logró un rendimiento de medalla de oro en las matemáticas de competición de IMO 2025 e IOI 2025.
Guías, tutoriales y novedades de producto para aprovechar al máximo Atlas Cloud.
Join the Discord community for the latest model updates, prompts, and support.