Moonshot AI Models on AtlasCloud | Kimi

A Atlas Cloud hospeda a linha completa do Kimi por meio da MoonshotAI API, desde o K2-Thinking para raciocínio profundo até o K2.6 para programação baseada em agentes. Tudo com pagamento conforme o uso, 262K de contexto.

Large Language Models by Moonshot AI

Impulsione chat, raciocínio e agentes em larga escala com os principais grandes modelos de linguagem, entregues de forma rápida e acessível na Atlas Cloud.

Ver todos os modelos

LLM

Kimi

A Kimi API é a linha K2 de pesos abertos da Moonshot AI, que vai do K2.5 nativamente multimodal ao K2.7 Code especializado em programação. Como a visão já vem integrada ao modelo, você pode transformar capturas de tela, mockups de UI e vídeos curtos em código frontend funcional, coordenar até 100 subagentes paralelos e raciocinar em um contexto de 256K tokens. A Atlas Cloud disponibiliza toda a família por meio de um único endpoint unificado, com preços transparentes no modelo pay-as-you-go. Comece a criar hoje mesmo.

4 modelosExplorar Kimi

Moonshot AI Models API Pricing Details

Compare standard vs. our pricing across every Moonshot AI model.

Model	Standard Price (USD)	Our Price (USD)	Discount
Kimi K3	$3/$15per 1M tokens1048.6K context	$3/$15M in/outper 1M tokens1048.6K context	—	View
Kimi K2.7 Code	$0.95/$4per 1M tokens262.1K context	$0.95/$4M in/outper 1M tokens262.1K context	—	View
Kimi K2.6	$0.95/$4per 1M tokens262.1K context	$0.95/$4M in/outper 1M tokens262.1K context	—	View
Kimi K2.5	$0.6/$3per 1M tokens262.1K context	$0.49/$2.5M in/outper 1M tokens262.1K context	—	View

Explore models from other providers

Instantly explore and experiment with 400+ production-ready models in the Atlas Playground. Start customizing with one click.

xAI

Casos de uso da API da Moonshot AI que você pode desenvolver na Atlas Cloud

O enxame de agentes e as capacidades de execução a longo prazo do Kimi permitem que as equipes executem tarefas que levariam dias de esforço humano em uma única sessão automatizada. As equipes usam a série M junto com o K2-Thinking para cobrir tudo, desde alterações autônomas de código até pesquisas de múltiplos documentos em grande escala.

Modernização de Código Legado

As equipes de engenharia usam o Kimi K2.6 para executar agentes de codificação de longo prazo que reformulam autonomamente bases de código de produção durante sessões prolongadas de várias horas. Em um exemplo documentado, o K2.6 reescreveu um mecanismo de correspondência financeira de 8 anos ao longo de 13 horas e entregou uma melhoria de 185% na taxa de transferência sem intervenção humana entre os commits. A precificação de pagamento conforme o uso da Atlas Cloud torna prático executar essas sessões prolongadas de agentes sem compromissos de capacidade.

Processamento paralelo de documentos em lote

As equipes de operações usam o enxame de 300 agentes do Kimi K2.6 para processar grandes lotes de documentos em paralelo. Uma única execução de orquestração combinou um currículo com 100 cargos e produziu 100 currículos totalmente personalizados como resultado. O mesmo padrão se aplica à revisão de contratos, verificações de conformidade e qualquer fluxo de trabalho onde uma entrada fixa precise ser avaliada em relação a um conjunto grande e variável de alvos.

Raciocínio Profundo para Análise Complexa

As equipes de pesquisa e jurídicas usam o Kimi K2-Thinking para problemas de análise de várias etapas que exigem um raciocínio interno prolongado. O modelo suporta até 200 a 300 chamadas de ferramentas sequenciais por sessão, iterando por ciclos de raciocínio-chamada-raciocínio sem prompts humanos entre as etapas. No Atlas Cloud, o preço é de US$ 0,6 por milhão de tokens de entrada e compartilha a janela de contexto de 262K com o restante da linha Kimi.

Produção automatizada de artigos científicos

Equipes acadêmicas e de conteúdo usam o Kimi K2.6 para transformar documentos de origem em resultados de pesquisa completos. Em uma execução de demonstração, o K2.6 converteu um artigo de astrofísica em um artigo de pesquisa de 40 páginas, um conjunto de dados estruturado com mais de 20.000 entradas e 14 gráficos de nível astronômico em uma única sessão. Isso reduz o tempo de resposta dos fluxos de trabalho de literatura para resultados de semanas para horas.

Prospecção de Negócios em Larga Escala

As equipes de crescimento e vendas usam os enxames do Kimi K2.6 para identificar clientes em potencial e gerar ativos de divulgação em paralelo. Uma execução de exemplo identificou 30 lojas de varejo em uma cidade-alvo sem sites e gerou uma landing page para cada uma. O mesmo padrão funciona para o enriquecimento de leads, mapeamento do cenário competitivo e qualquer tarefa que combine descoberta e geração de conteúdo em escala de lista.

Análise Visual de Documentos e Código

As equipes de produtos e dados utilizam as capacidades de visão nativas do Kimi K2.5 e K2.6 para processar entradas de imagem e vídeo juntamente com texto na mesma chamada de API. O codificador MoonViT lida com diagramas, capturas de tela, mockups de UI e digitalizações de documentos sem pré-processamento externo. Isso é útil para pipelines que convertem especificações visuais diretamente em código, ou extraem dados estruturados de documentos ricos em imagens.

Transforme a visão da sua empresa em realidade com a Atlas Cloud AI.

Fale com vendas

Perguntas frequentes sobre os modelos da Moonshot AI

Kimi K2.6 is MoonshotAI's latest open-source multimodal LLM, released in April 2026 under a Modified MIT license. It runs a Mixture-of-Experts architecture with 1 trillion total parameters and 32 billion active during inference. It is designed for agentic coding, long-horizon task execution, and multi-agent swarm orchestration.

O Kimi K2.6 escala para 300 subagentes executando até 4.000 etapas coordenadas em uma única execução. O Kimi K2.5 no Atlas Cloud suporta execução em enxame com até 100 subagentes. As tarefas são decompostas dinamicamente em subtarefas paralelas e especializadas no domínio para uma saída totalmente autônoma.

O Kimi K2-Thinking utiliza raciocínio profundo de cadeia de pensamento com até 200 a 300 chamadas sequenciais de ferramentas por sessão. O modelo raciocina, chama uma ferramenta, interpreta o resultado, chama outra ferramenta e continua esse ciclo sem intervenção humana. É adequado para inferência lógica de várias etapas, matemática complexa e problemas em que o raciocínio interno prolongado melhora a precisão.

Sim. O Kimi K2.5 e K2.6 incluem o MoonViT, um codificador de visão de 400 milhões de parâmetros que processa imagens e vídeos nativamente. Você pode passar entradas de imagem ou vídeo diretamente na chamada da API junto com o texto, sem pré-processamento externo. Isso oferece suporte a fluxos de trabalho de análise visual, compreensão de documentos e geração de imagem para código.

Sim. Kimi K2.6 é lançado sob uma licença MIT modificada, que permite uso comercial. Pesos abertos estão disponíveis no HuggingFace para implantações auto-hospedadas. A Atlas Cloud também fornece o K2.6 via API para equipes que preferem acesso gerenciado sem a sobrecarga de infraestrutura.

O Kimi K2.6 atinge 80,2% no SWE-Bench Verified e 54,0% no Humanity's Last Exam com ferramentas, superando o GPT-5.5 em ambos os benchmarks. Ele também lidera no BrowseComp com 83,2%, acima do GPT-5.4. Esses resultados são alcançados com um custo por milhão de tokens cerca de 80% menor que o do GPT-5.5.

O Kimi K2.5 tem um preço de US$ 0,49 por milhão de tokens de entrada e US$ 2,5 por milhão de tokens de saída no Atlas Cloud. O Kimi K2-Thinking e o K2-Instruct-0905 funcionam a US$ 0,6 por milhão de tokens de entrada com a mesma taxa de saída. Verifique a página do modelo Kimi K2.6 no Atlas Cloud para obter seus preços específicos atuais.

Explorar Mais Séries

Seedance 2.0

A API do Seedance 2.0 oferece acesso de produção ao modelo de vídeo multimodal da ByteDance — entradas quadrimodais (texto, imagem, vídeo, áudio) e um sistema "Universal Reference" líder do setor que fixa a composição, o movimento da câmera e as ações dos personagens entre as cenas. Integre um controle de nível de diretor com uma única chamada de API, uma taxa fixa de $0,09/s, chave instantânea e sem lista de espera — respaldado por tempo de atividade e conformidade de nível corporativo. O Seedance 2.0 Native 4K já está no ar!

Ver Série

Grok Imagine

A Grok Imagine API oferece aos desenvolvedores a geração de imagens, vídeos e áudio da xAI em um único pacote. Ela produz imagens de até 2K com renderização de texto multilíngue, além de vídeos de até 15 segundos com áudio nativo sincronizado e edição baseada em referências. Na Atlas Cloud, uma única chave executa todos os modos do Grok Imagine, permitindo que você alterne entre imagem, vídeo e áudio sem configurações separadas, a partir de US$ 0,02 por imagem e US$ 0,05 por segundo.

Ver Série

Gemini Omni Flash

A Gemini Omni API traz para o seu stack o modelo multimodal de geração e edição de vídeo do Google DeepMind, apresentado no Google I/O 2026. O Gemini Omni funde o motor de raciocínio do Gemini com mídia generativa, aceitando qualquer combinação de texto, imagens, vídeo e áudio para produzir resultados consistentes e fundamentados em conhecimento. Refine os resultados por meio de conversas naturais — troque objetos, reescreva cenas e mude estilos, enquanto a física, os personagens e a continuidade permanecem intactos. A Atlas Cloud oferece toda a linha Gemini Omni Flash — texto para vídeo, imagem para vídeo com até 7 imagens de referência e referência para vídeo — por meio de uma única API unificada, com preços transparentes por segundo a partir de $0.112 e sem assinatura. Comece a construir hoje mesmo.

Ver Série

GPT Image 2

A API do GPT Image 2 dá aos desenvolvedores acesso ao mais recente modelo de imagem da OpenAI, o sucessor do GPT Image 1.5. Ele gera e edita imagens com renderização de texto precisa em caracteres latinos e CJK, além de uma forte composição para pôsteres, mockups e infográficos. Na Atlas Cloud, você o acessa através de uma API unificada junto a mais de 300 modelos, com créditos gratuitos, 99,99% de tempo de atividade e sem a necessidade de verificação de organização da OpenAI.

Ver Série

Google

Os modelos criativos mais poderosos do Google estão todos disponíveis na Atlas Cloud. O Veo 3.1 oferece geração de vídeo cinematográfico, o Nano Banana 2 impulsiona a criação de imagens de alta fidelidade e o Gemini traz inteligência multimodal para cada fluxo de trabalho. Acesse o pacote completo de modelos do Google por meio de uma única API key com disponibilidade Day-0 e preços de pagamento conforme o uso (pay-as-you-go).

Ver Série

Seedance 2.0 Mini

O Seedance 2.0 Mini leva a geração de vídeo multimodal da ByteDance para fluxos de trabalho onde a velocidade e o custo são essenciais. Ele oferece os principais recursos do Seedance 2.0 com menor impacto — geração mais rápida, menor custo por vídeo e a mesma integração de API que você já usa. Para equipes que executam pipelines de alto volume ou prototipagem em escala, o Mini é a opção padrão prática.

Ver Série

ByteDance

Da geração de vídeo cinematográfico à criação de imagens de alta fidelidade, os modelos mais poderosos da ByteDance estão disponíveis no Atlas Cloud. Execute o Seedance e o Seedream em grande escala com os preços de inferência mais baixos e zero custos indiretos de infraestrutura.

Ver Série

Alibaba

O Atlas Cloud reúne toda a linha de modelos da Alibaba sob uma única API: Qwen para tarefas de linguagem e imagem, e Wan para geração de vídeo em até 1080p. Acesse cada modelo no formato pré-pago (pay-as-you-go) sem necessidade de assinaturas. A API da Alibaba está disponível por meio de uma única URL base usando seu cliente compatível com OpenAI existente.

Ver Série

OpenAI

O Atlas Cloud oferece acesso a toda a linha da API da OpenAI, desde o GPT Image 2 para geração de imagens até o Sora 2 para vídeo. Todos os modelos estão disponíveis na modalidade de pagamento conforme o uso, sem compromisso mensal. Integre-se trocando apenas uma URL base usando a API compatível com a OpenAI.

Ver Série

xAI

Construa pipelines completos de imagem e vídeo usando a xAI API no Atlas Cloud. Gere em 2K, edite com imagens de referência e anime imagens em clipes sincronizados com áudio.

Ver Série

Kwaivgi

A API da Kwaivgi com preço 15% abaixo do padrão. A Atlas Cloud oferece acesso Day-0 a novos lançamentos da Kling com preços de pagamento conforme o uso e sem limite de assentos. Uma conta, uma chave, todos os modelos da Kling do nível padrão ao nível master.

Ver Série

Seedream 5.0 Pro

A API do Seedream 5.0 Pro fornece aos desenvolvedores o modelo de edição de imagens controlável da ByteDance no Atlas Cloud. Ela posiciona as edições com precisão usando âncoras e coordenadas, separa as imagens em camadas editáveis, funde múltiplas referências e combina cores e materiais exatos, com texto multilíngue em 2K e 3K. No Atlas Cloud, você pode acessá-lo por meio de uma única chave!

Ver Série