kwaipilot/kat-coder-pro-v2

LLM

PRO

KAT Coder Pro is KwaiKAT's most advanced agentic coding model in the KAT-Coder series. Designed specifically for agentic coding tasks, it excels in real-world software engineering scenarios, achieving 73.4% solve rate on the SWE-Bench Verified benchmark.

Parâmetros

Exemplo de código
import os
from openai import OpenAI

client = OpenAI(
    api_key=os.getenv("ATLASCLOUD_API_KEY"),
    base_url="https://api.atlascloud.ai/v1"
)

response = client.chat.completions.create(
    model="kwaipilot/kat-coder-pro-v2",
    messages=[
    {
        "role": "user",
        "content": "hello"
    }
],
    max_tokens=1024,
    temperature=0.7
)

print(response.choices[0].message.content)

Instalar

Instale o pacote necessário para a sua linguagem de programação.

bash

pip install requests

Autenticação

Todas as solicitações de API requerem autenticação por meio de uma chave de API. Você pode obter sua chave de API no painel do Atlas Cloud.

bash

export ATLASCLOUD_API_KEY="your-api-key-here"

Cabeçalhos HTTP

python

import os

API_KEY = os.environ.get("ATLASCLOUD_API_KEY")
headers = {
    "Content-Type": "application/json",
    "Authorization": f"Bearer {API_KEY}"
}

Mantenha sua chave de API segura

Nunca exponha sua chave de API em código do lado do cliente ou repositórios públicos. Use variáveis de ambiente ou um proxy de backend.

Enviar uma solicitação

import requests

url = "https://api.atlascloud.ai/v1/chat/completions"
headers = {
    "Content-Type": "application/json",
    "Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
    "model": "your-model",
    "messages": [{"role": "user", "content": "Hello"}],
    "max_tokens": 1024
}

response = requests.post(url, headers=headers, json=data)
print(response.json())

Schema de entrada

Os seguintes parâmetros são aceitos no corpo da solicitação.

Total: 9Obrigatório: 2Opcional: 7

modelstringrequired

The model ID to use for the completion.

Example: "kwaipilot/kat-coder-pro-v2"

messagesarray[object]required

A list of messages comprising the conversation so far.

rolestringrequired

The role of the message author. One of "system", "user", or "assistant".

systemuserassistant

contentstringrequired

The content of the message.

max_tokensinteger

The maximum number of tokens to generate in the completion.

Default: 1024Min: 1

temperaturenumber

Sampling temperature between 0 and 2. Higher values make output more random, lower values more focused and deterministic.

Default: 0.7Min: 0Max: 2

top_pnumber

Nucleus sampling parameter. The model considers the tokens with top_p probability mass.

Default: 1Min: 0Max: 1

streamboolean

If set to true, partial message deltas will be sent as server-sent events.

Default: false

stoparray[string]

Up to 4 sequences where the API will stop generating further tokens.

frequency_penaltynumber

Penalizes new tokens based on their existing frequency in the text so far. Between -2.0 and 2.0.

Default: 0Min: -2Max: 2

presence_penaltynumber

Penalizes new tokens based on whether they appear in the text so far. Between -2.0 and 2.0.

Default: 0Min: -2Max: 2

Exemplo de corpo da solicitação

json

{
  "model": "kwaipilot/kat-coder-pro-v2",
  "messages": [
    {
      "role": "user",
      "content": "Hello"
    }
  ],
  "max_tokens": 1024,
  "temperature": 0.7,
  "stream": false
}

Schema de saída

A API retorna uma resposta compatível com ChatCompletion.

idstringrequired

Unique identifier for the completion.

objectstringrequired

Object type, always "chat.completion".

Default: "chat.completion"

createdintegerrequired

Unix timestamp of when the completion was created.

modelstringrequired

The model used for the completion.

choicesarray[object]required

List of completion choices.

indexintegerrequired

Index of the choice.

messageobjectrequired

The generated message.

finish_reasonstringrequired

The reason generation stopped.

stoplengthcontent_filter

usageobjectrequired

Token usage statistics.

prompt_tokensintegerrequired

Number of tokens in the prompt.

completion_tokensintegerrequired

Number of tokens in the completion.

total_tokensintegerrequired

Total tokens used.

Exemplo de resposta

json

{
  "id": "chatcmpl-abc123",
  "object": "chat.completion",
  "created": 1700000000,
  "model": "model-name",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "Hello! How can I assist you today?"
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 10,
    "completion_tokens": 20,
    "total_tokens": 30
  }
}

Atlas Cloud Skills

O Atlas Cloud Skills integra mais de 300 modelos de IA diretamente no seu assistente de codificação com IA. Um comando para instalar e depois use linguagem natural para gerar imagens, vídeos e conversar com LLM.

Clientes compatíveis

Claude Code

OpenAI Codex

Gemini CLI

Cursor

Windsurf

VS Code

Trae

GitHub Copilot

Cline

Roo Code

Amp

Goose

Replit

40+ clientes compatíveis

Instalar

bash

npx skills add AtlasCloudAI/atlas-cloud-skills

Configurar chave de API

Obtenha sua chave de API no painel do Atlas Cloud e defina-a como variável de ambiente.

bash

export ATLASCLOUD_API_KEY="your-api-key-here"

Funcionalidades

Após a instalação, você pode usar linguagem natural no seu assistente de IA para acessar todos os modelos do Atlas Cloud.

Geração de imagensGere imagens com modelos como Nano Banana 2, Z-Image e mais.

Criação de vídeosCrie vídeos a partir de texto ou imagens com Kling, Vidu, Veo, etc.

Chat com LLMConverse com Qwen, DeepSeek e outros modelos de linguagem de grande escala.

Upload de mídiaEnvie arquivos locais para fluxos de trabalho de edição de imagens e imagem para vídeo.

Saiba mais

github.com/AtlasCloudAI/atlas-cloud-skills

MCP Server

O Atlas Cloud MCP Server conecta seu IDE com mais de 300 modelos de IA através do Model Context Protocol. Funciona com qualquer cliente compatível com MCP.

Clientes compatíveis

Cursor

VS Code

Windsurf

Claude Code

OpenAI Codex

Gemini CLI

Cline

Roo Code

100+ clientes compatíveis

Instalar

bash

npx -y atlascloud-mcp

Configuração

Adicione a seguinte configuração ao arquivo de configuração de MCP do seu IDE.

json

{
  "mcpServers": {
    "atlascloud": {
      "command": "npx",
      "args": [
        "-y",
        "atlascloud-mcp"
      ],
      "env": {
        "ATLASCLOUD_API_KEY": "your-api-key-here"
      }
    }
  }
}

Ferramentas disponíveis

atlas_generate_imageGere imagens a partir de prompts de texto.

atlas_generate_videoCrie vídeos a partir de texto ou imagens.

atlas_chatConverse com modelos de linguagem de grande escala.

atlas_list_modelsExplore mais de 300 modelos de IA disponíveis.

atlas_quick_generateCriação de conteúdo em uma etapa com seleção automática de modelo.

atlas_upload_mediaEnvie arquivos locais para fluxos de trabalho de API.

Saiba mais

github.com/AtlasCloudAI/mcp-server

Codificação IA de Elite

KAT-Coder: Geração de Código IA de Elite

73,4% SWE-Bench Verified - Superando Líderes da Indústria

KAT-Coder é o modelo de codificação IA de código fechado principal da Kwaipilot (divisão de pesquisa de IA da Kuaishou), representando o ápice da tecnologia de geração de código agêntico. Alimentado por uma arquitetura Mixture-of-Experts com 72 bilhões de parâmetros ativos e treinado através de aprendizado por reforço agêntico em grande escala, KAT-Coder alcança 73,4% no SWE-Bench Verified, classificando-se entre os melhores modelos de geração de código globalmente ao lado do GPT-5 High e Claude Sonnet 4.5.

73.4%

Pontuação SWE-Bench Verificada

256K

Janela de Contexto

72B

Parâmetros Ativos

Desempenho Líder da Indústria

KAT-Coder compete com os melhores modelos de geração de código do mundo no SWE-Bench Verified, o benchmark padrão da indústria para tarefas de engenharia de software do mundo real

🥇

Claude Sonnet 4.5

77.2%

🥈

GPT-5 High

74.9%

🥉

KAT-Coder Pro

73.4%

* Baseado em pontuações do benchmark SWE-Bench Verified. O desempenho pode variar em diferentes tarefas de geração de código.

Capacidades Principais

Arquitetura Mixture-of-Experts

Aproveita design MoE avançado com 72 bilhões de parâmetros ativos de mais de 1 trilhão no total, oferecendo desempenho de ponta em tarefas complexas de engenharia de software.

72 bilhões de parâmetros ativos para eficiência ideal
Construído sobre a família de modelos Qwen
Otimizado para bases de código em escala empresarial

Aprendizado por Reforço Agêntico

Treinado através de pipeline multi-estágio incluindo RL agêntico em grande escala, permitindo conclusão autônoma de tarefas complexas de engenharia de software.

Otimização de trajetória de prefixo compartilhado
Mecanismo de vantagem de modelagem de entropia
Treinamento em commits e PRs reais do Git

Integração Multi-Ferramentas

Capacidades integradas para interagir com milhares de ferramentas através de dados de execução reais em sandbox, permitindo fluxos de trabalho práticos de desenvolvimento de software.

Dados de interação de milhares de ferramentas
Execução real em ambientes sandbox
Integração perfeita de API e CLI

Janela de Contexto de 256K

Suporte extenso de contexto permite lidar com interações de codificação sofisticadas de múltiplos turnos e gerenciar bases de código em grande escala efetivamente.

Lidar com vários arquivos simultaneamente
Manter histórico conversacional longo
Raciocínio e refatoração entre arquivos

Treinamento Nativo em Git

Treinado em dados reais de commits e PRs do Git de repositórios empresariais, compreendendo nativamente fluxos de trabalho de controle de versão.

Padrões de commits de repositórios reais
Melhores práticas de pull request
Padrões de revisão de código e colaboração

Qualidade de Nível Empresarial

Dados específicos de domínio de alta qualidade incluindo seguimento de instruções em mais de 30 categorias e capacidades de raciocínio geral.

Mais de 30 categorias de seguimento de instruções
Raciocínio avançado para casos extremos
Geração de código pronta para produção

Pipeline de Treinamento Multi-Estágio

A metodologia de treinamento do KAT-Coder representa um avanço significativo em modelos de codificação IA, combinando vários estágios de treinamento para desempenho ideal

Treinamento Intermediário

Estágio fundamental com injeção de conhecimento de codificação e dados específicos de domínio de alta qualidade

→

Ajuste Fino Supervisionado (SFT)

Seguimento de instruções e treinamento de diálogo em mais de 30 categorias

→

Ajuste Fino por Reforço (RFT)

Capacidades aprimoradas de raciocínio e resolução de problemas

→

Aprendizado por Reforço Agêntico

RL em grande escala em bases de código empresariais com conclusão autônoma de tarefas

Perfeito Para

🐛

Depuração Complexa

Identificar e corrigir bugs em grandes bases de código com compreensão de contexto multi-arquivo

🔧

Refatoração de Grandes Bases de Código

Refatoração sistemática com consciência de padrões arquiteturais e dependências

📝

Geração de Código Multi-Arquivo

Gerar código coerente em vários arquivos com integração adequada

📚

Compreensão de Repositório

Analisar e compreender grandes repositórios com insights arquiteturais profundos

Especificações Técnicas

arquiteturaMixture-of-Experts (MoE)

parâmetros_ativos~72 bilhões

parâmetros_totais>1 trilhão

janela_de_contexto256.000 tokens

modelo_baseFamília Qwen

uso_de_ferramentasMilhares de ferramentas

diálogo_multi_turnoCentenas de turnos

categorias_de_instrucoesMais de 30 categorias

licençaCódigo fechado (Comercial)

variantes_open_sourceKAT-Dev-32B, KAT-Dev-72B-Exp

Variantes Open Source

Embora o KAT-Coder Pro seja de código fechado, a Kwaipilot lançou alternativas open source disponíveis no HuggingFace sob licença Apache-2.0

KAT-Dev-32B

Open Source

Variante otimizada de 32 bilhões de parâmetros com treinamento multi-estágio incluindo ajuste fino supervisionado e aprendizado por reforço.

Licença Apache-2.0 para uso comercial

Disponível no HuggingFace

Desempenho pronto para produção

KAT-Dev-72B-Exp

Experimental

Variante experimental de 72 bilhões de parâmetros expandindo os limites das capacidades de geração de código open source.

Modelo maior para tarefas complexas

Capacidades de raciocínio avançadas

Uso em pesquisa e produção

Experimente Geração de Código de Elite

Comece a usar KAT-Coder hoje através da nossa API. Junte-se a desenvolvedores em todo o mundo que confiam no KAT-Coder para tarefas críticas de engenharia de software.

Pontuação líder da indústria de 73,4% no SWE-Bench

256K de contexto para grandes bases de código

Suporte de integração multi-ferramentas