
Atlas Cloud aloja la línea completa de Kimi a través de la MoonshotAI API, desde K2-Thinking para el razonamiento profundo hasta K2.6 para la programación de agentes. Todo de pago por uso, con 262K de contexto.
Impulsa chat, razonamiento y agentes a gran escala con los principales grandes modelos de lenguaje, servidos de forma rápida y asequible en Atlas Cloud.
Compare standard vs. our pricing across every Moonshot AI model.
| Model | Standard Price (USD) | Our Price (USD) | Discount | |
|---|---|---|---|---|
| Kimi K2.5 | $0.6/$3per 1M tokens262.1K context | $0.49/$2.5M in/outper 1M tokens262.1K context | — | View |
| Kimi-K2-Thinking | $0.6/$2.5per 1M tokens262.1K context | $0.6/$2.5M in/outper 1M tokens262.1K context | — | View |
| Kimi-K2-Instruct-0905 | $0.6/$2.5per 1M tokens262.1K context | $0.6/$2.5M in/outper 1M tokens262.1K context | — | View |
| Kimi-K2-Instruct | $0.6/$2.5per 1M tokens131.1K context | $0.7/$2.5M in/outper 1M tokens131.1K context | — | View |
Instantly explore and experiment with 300+ production-ready models in the Atlas Playground. Start customizing with one click.
El enjambre de agentes y las capacidades de ejecución a largo plazo de Kimi permiten a los equipos ejecutar tareas que requerirían días de esfuerzo humano en una sola sesión automatizada. Los equipos utilizan la serie M junto con K2-Thinking para abarcar todo, desde cambios de código autónomos hasta investigaciones de múltiples documentos a gran escala.
Los equipos de ingeniería utilizan Kimi K2.6 para ejecutar agentes de programación a largo plazo que revisan y modifican de forma autónoma bases de código de producción durante sesiones extendidas de varias horas. En un ejemplo documentado, K2.6 reescribió un motor de emparejamiento financiero de 8 años de antigüedad a lo largo de 13 horas y logró una mejora del rendimiento del 185 % sin intervención humana entre confirmaciones (commits). El modelo de precios de pago por uso de Atlas Cloud hace que sea práctico ejecutar estas sesiones extendidas de agentes sin compromisos de capacidad.
Los equipos de operaciones utilizan el enjambre de 300 agentes de Kimi K2.6 para procesar grandes lotes de documentos en paralelo. Una sola ejecución de orquestación emparejó un currículum con 100 roles de trabajo y produjo 100 currículums completamente personalizados como resultado. El mismo patrón se aplica a la revisión de contratos, comprobaciones de cumplimiento y cualquier flujo de trabajo donde una entrada fija deba ser evaluada frente a un conjunto grande y variable de objetivos.
Los equipos legales y de investigación utilizan Kimi K2-Thinking para problemas de análisis de múltiples pasos que requieren un razonamiento interno prolongado. El modelo admite hasta 200 a 300 llamadas de herramientas secuenciales por sesión, iterando a través de ciclos de razonamiento-llamada-razonamiento sin indicaciones humanas entre pasos. En Atlas Cloud tiene un precio de $0.6 por millón de tokens de entrada y comparte la ventana de contexto de 262K con el resto de la línea Kimi.
Los equipos académicos y de contenido utilizan Kimi K2.6 para convertir documentos de origen en resultados de investigación completos. En una ejecución de demostración, K2.6 convirtió un artículo de astrofísica en un artículo de investigación de 40 páginas, un conjunto de datos estructurado con más de 20.000 entradas y 14 gráficos de nivel astronómico en una sola sesión. Esto reduce el tiempo de respuesta de los flujos de trabajo de literatura a resultados de semanas a horas.
Los equipos de crecimiento y ventas utilizan los enjambres de Kimi K2.6 para identificar clientes potenciales y generar activos de alcance en paralelo. Una ejecución de ejemplo identificó 30 tiendas minoristas en una ciudad objetivo sin sitios web y generó una página de aterrizaje para cada una. El mismo patrón funciona para el enriquecimiento de prospectos, el mapeo del panorama competitivo y cualquier tarea que combine el descubrimiento y la generación de contenido a escala de lista.
Los equipos de productos y datos utilizan las capacidades de visión nativas de Kimi K2.5 y K2.6 para procesar entradas de imagen y video junto con texto en la misma llamada de API. El codificador MoonViT maneja diagramas, capturas de pantalla, maquetas de UI y escaneos de documentos sin preprocesamiento externo. Esto es útil para los pipelines que convierten especificaciones visuales directamente en código, o extraen datos estructurados de documentos con gran cantidad de imágenes.
Kimi K2.6 is MoonshotAI's latest open-source multimodal LLM, released in April 2026 under a Modified MIT license. It runs a Mixture-of-Experts architecture with 1 trillion total parameters and 32 billion active during inference. It is designed for agentic coding, long-horizon task execution, and multi-agent swarm orchestration.
Kimi K2.6 escala a 300 subagentes que ejecutan hasta 4.000 pasos coordinados en una sola ejecución. Kimi K2.5 en Atlas Cloud admite la ejecución en enjambre con hasta 100 subagentes. Las tareas se descomponen dinámicamente en subtareas paralelas y especializadas en el dominio para una salida totalmente autónoma.
Kimi K2-Thinking utiliza un razonamiento profundo de cadena de pensamiento con hasta 200 a 300 llamadas secuenciales a herramientas por sesión. El modelo razona, llama a una herramienta, interpreta el resultado, llama a otra herramienta y continúa este bucle sin intervención humana. Es adecuado para la inferencia lógica de múltiples pasos, matemáticas complejas y problemas en los que el razonamiento interno ampliado mejora la precisión.
Sí. Kimi K2.5 y K2.6 incluyen MoonViT, un codificador de visión de 400 millones de parámetros que procesa imágenes y vídeo de forma nativa. Puede pasar entradas de imagen o vídeo directamente en la llamada a la API junto con el texto sin preprocesamiento externo. Esto admite flujos de trabajo de análisis visual, comprensión de documentos y generación de imagen a código.
Sí. Kimi K2.6 se publica bajo una licencia MIT modificada, la cual permite su uso comercial. Los pesos abiertos están disponibles en HuggingFace para implementaciones autoalojadas. Atlas Cloud también ofrece K2.6 a través de API para los equipos que prefieren un acceso administrado sin gastos generales de infraestructura.
Kimi K2.6 obtiene una puntuación del 80,2 % en SWE-Bench Verified y del 54,0 % en Humanity's Last Exam con herramientas, superando a GPT-5.5 en ambos benchmarks. También lidera en BrowseComp con un 83,2 %, por encima de GPT-5.4. Estos resultados se logran con un coste por millón de tokens aproximadamente un 80 % menor que el de GPT-5.5.
Kimi K2.5 tiene un precio de 0,49 $ por millón de tokens de entrada y 2,5 $ por millón de tokens de salida en Atlas Cloud. Kimi K2-Thinking y K2-Instruct-0905 funcionan a 0,6 $ por millón de tokens de entrada con la misma tarifa de salida. Consulte la página del modelo Kimi K2.6 de Atlas Cloud para conocer sus precios específicos actuales.
Guías, tutoriales y novedades de producto para aprovechar al máximo Atlas Cloud.
Join the Discord community for the latest model updates, prompts, and support.