
A Atlas Cloud hospeda a linha completa do Kimi por meio da MoonshotAI API, desde o K2-Thinking para raciocínio profundo até o K2.6 para programação baseada em agentes. Tudo com pagamento conforme o uso, 262K de contexto.
Impulsione chat, raciocínio e agentes em larga escala com os principais grandes modelos de linguagem, entregues de forma rápida e acessível na Atlas Cloud.
Compare standard vs. our pricing across every Moonshot AI model.
| Model | Standard Price (USD) | Our Price (USD) | Discount | |
|---|---|---|---|---|
| Kimi K2.5 | $0.6/$3per 1M tokens262.1K context | $0.49/$2.5M in/outper 1M tokens262.1K context | — | View |
| Kimi-K2-Thinking | $0.6/$2.5per 1M tokens262.1K context | $0.6/$2.5M in/outper 1M tokens262.1K context | — | View |
| Kimi-K2-Instruct-0905 | $0.6/$2.5per 1M tokens262.1K context | $0.6/$2.5M in/outper 1M tokens262.1K context | — | View |
| Kimi-K2-Instruct | $0.6/$2.5per 1M tokens131.1K context | $0.7/$2.5M in/outper 1M tokens131.1K context | — | View |
Instantly explore and experiment with 300+ production-ready models in the Atlas Playground. Start customizing with one click.
O enxame de agentes e as capacidades de execução a longo prazo do Kimi permitem que as equipes executem tarefas que levariam dias de esforço humano em uma única sessão automatizada. As equipes usam a série M junto com o K2-Thinking para cobrir tudo, desde alterações autônomas de código até pesquisas de múltiplos documentos em grande escala.
As equipes de engenharia usam o Kimi K2.6 para executar agentes de codificação de longo prazo que reformulam autonomamente bases de código de produção durante sessões prolongadas de várias horas. Em um exemplo documentado, o K2.6 reescreveu um mecanismo de correspondência financeira de 8 anos ao longo de 13 horas e entregou uma melhoria de 185% na taxa de transferência sem intervenção humana entre os commits. A precificação de pagamento conforme o uso da Atlas Cloud torna prático executar essas sessões prolongadas de agentes sem compromissos de capacidade.
As equipes de operações usam o enxame de 300 agentes do Kimi K2.6 para processar grandes lotes de documentos em paralelo. Uma única execução de orquestração combinou um currículo com 100 cargos e produziu 100 currículos totalmente personalizados como resultado. O mesmo padrão se aplica à revisão de contratos, verificações de conformidade e qualquer fluxo de trabalho onde uma entrada fixa precise ser avaliada em relação a um conjunto grande e variável de alvos.
As equipes de pesquisa e jurídicas usam o Kimi K2-Thinking para problemas de análise de várias etapas que exigem um raciocínio interno prolongado. O modelo suporta até 200 a 300 chamadas de ferramentas sequenciais por sessão, iterando por ciclos de raciocínio-chamada-raciocínio sem prompts humanos entre as etapas. No Atlas Cloud, o preço é de US$ 0,6 por milhão de tokens de entrada e compartilha a janela de contexto de 262K com o restante da linha Kimi.
Equipes acadêmicas e de conteúdo usam o Kimi K2.6 para transformar documentos de origem em resultados de pesquisa completos. Em uma execução de demonstração, o K2.6 converteu um artigo de astrofísica em um artigo de pesquisa de 40 páginas, um conjunto de dados estruturado com mais de 20.000 entradas e 14 gráficos de nível astronômico em uma única sessão. Isso reduz o tempo de resposta dos fluxos de trabalho de literatura para resultados de semanas para horas.
As equipes de crescimento e vendas usam os enxames do Kimi K2.6 para identificar clientes em potencial e gerar ativos de divulgação em paralelo. Uma execução de exemplo identificou 30 lojas de varejo em uma cidade-alvo sem sites e gerou uma landing page para cada uma. O mesmo padrão funciona para o enriquecimento de leads, mapeamento do cenário competitivo e qualquer tarefa que combine descoberta e geração de conteúdo em escala de lista.
As equipes de produtos e dados utilizam as capacidades de visão nativas do Kimi K2.5 e K2.6 para processar entradas de imagem e vídeo juntamente com texto na mesma chamada de API. O codificador MoonViT lida com diagramas, capturas de tela, mockups de UI e digitalizações de documentos sem pré-processamento externo. Isso é útil para pipelines que convertem especificações visuais diretamente em código, ou extraem dados estruturados de documentos ricos em imagens.
Kimi K2.6 is MoonshotAI's latest open-source multimodal LLM, released in April 2026 under a Modified MIT license. It runs a Mixture-of-Experts architecture with 1 trillion total parameters and 32 billion active during inference. It is designed for agentic coding, long-horizon task execution, and multi-agent swarm orchestration.
O Kimi K2.6 escala para 300 subagentes executando até 4.000 etapas coordenadas em uma única execução. O Kimi K2.5 no Atlas Cloud suporta execução em enxame com até 100 subagentes. As tarefas são decompostas dinamicamente em subtarefas paralelas e especializadas no domínio para uma saída totalmente autônoma.
O Kimi K2-Thinking utiliza raciocínio profundo de cadeia de pensamento com até 200 a 300 chamadas sequenciais de ferramentas por sessão. O modelo raciocina, chama uma ferramenta, interpreta o resultado, chama outra ferramenta e continua esse ciclo sem intervenção humana. É adequado para inferência lógica de várias etapas, matemática complexa e problemas em que o raciocínio interno prolongado melhora a precisão.
Sim. O Kimi K2.5 e K2.6 incluem o MoonViT, um codificador de visão de 400 milhões de parâmetros que processa imagens e vídeos nativamente. Você pode passar entradas de imagem ou vídeo diretamente na chamada da API junto com o texto, sem pré-processamento externo. Isso oferece suporte a fluxos de trabalho de análise visual, compreensão de documentos e geração de imagem para código.
Sim. Kimi K2.6 é lançado sob uma licença MIT modificada, que permite uso comercial. Pesos abertos estão disponíveis no HuggingFace para implantações auto-hospedadas. A Atlas Cloud também fornece o K2.6 via API para equipes que preferem acesso gerenciado sem a sobrecarga de infraestrutura.
O Kimi K2.6 atinge 80,2% no SWE-Bench Verified e 54,0% no Humanity's Last Exam com ferramentas, superando o GPT-5.5 em ambos os benchmarks. Ele também lidera no BrowseComp com 83,2%, acima do GPT-5.4. Esses resultados são alcançados com um custo por milhão de tokens cerca de 80% menor que o do GPT-5.5.
O Kimi K2.5 tem um preço de US$ 0,49 por milhão de tokens de entrada e US$ 2,5 por milhão de tokens de saída no Atlas Cloud. O Kimi K2-Thinking e o K2-Instruct-0905 funcionam a US$ 0,6 por milhão de tokens de entrada com a mesma taxa de saída. Verifique a página do modelo Kimi K2.6 no Atlas Cloud para obter seus preços específicos atuais.
Guias, tutoriais e novidades de produto para você aproveitar ao máximo a Atlas Cloud.
Join the Discord community for the latest model updates, prompts, and support.