kwaipilot/kat-coder-pro-v2

KAT Coder Pro is KwaiKAT's most advanced agentic coding model in the KAT-Coder series. Designed specifically for agentic coding tasks, it excels in real-world software engineering scenarios, achieving 73.4% solve rate on the SWE-Bench Verified benchmark.

LLMNEWHOT
Início
Explorar
kwaipilot/kat-coder-pro-v2
KAT Coder Pro V2
LLM
PRO

KAT Coder Pro is KwaiKAT's most advanced agentic coding model in the KAT-Coder series. Designed specifically for agentic coding tasks, it excels in real-world software engineering scenarios, achieving 73.4% solve rate on the SWE-Bench Verified benchmark.

Parâmetros

Exemplo de código

import os
from openai import OpenAI

client = OpenAI(
    api_key=os.getenv("ATLASCLOUD_API_KEY"),
    base_url="https://api.atlascloud.ai/v1"
)

response = client.chat.completions.create(
    model="kwaipilot/kat-coder-pro-v2",
    messages=[
    {
        "role": "user",
        "content": "hello"
    }
],
    max_tokens=1024,
    temperature=0.7
)

print(response.choices[0].message.content)

Instalar

Instale o pacote necessário para a sua linguagem de programação.

bash
pip install requests

Autenticação

Todas as solicitações de API requerem autenticação por meio de uma chave de API. Você pode obter sua chave de API no painel do Atlas Cloud.

bash
export ATLASCLOUD_API_KEY="your-api-key-here"

Cabeçalhos HTTP

python
import os

API_KEY = os.environ.get("ATLASCLOUD_API_KEY")
headers = {
    "Content-Type": "application/json",
    "Authorization": f"Bearer {API_KEY}"
}
Mantenha sua chave de API segura

Nunca exponha sua chave de API em código do lado do cliente ou repositórios públicos. Use variáveis de ambiente ou um proxy de backend.

Enviar uma solicitação

import requests

url = "https://api.atlascloud.ai/v1/chat/completions"
headers = {
    "Content-Type": "application/json",
    "Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
    "model": "your-model",
    "messages": [{"role": "user", "content": "Hello"}],
    "max_tokens": 1024
}

response = requests.post(url, headers=headers, json=data)
print(response.json())

Schema de entrada

Os seguintes parâmetros são aceitos no corpo da solicitação.

Total: 9Obrigatório: 2Opcional: 7
modelstringrequired
The model ID to use for the completion.
Example: "kwaipilot/kat-coder-pro-v2"
messagesarray[object]required
A list of messages comprising the conversation so far.
rolestringrequired
The role of the message author. One of "system", "user", or "assistant".
systemuserassistant
contentstringrequired
The content of the message.
max_tokensinteger
The maximum number of tokens to generate in the completion.
Default: 1024Min: 1
temperaturenumber
Sampling temperature between 0 and 2. Higher values make output more random, lower values more focused and deterministic.
Default: 0.7Min: 0Max: 2
top_pnumber
Nucleus sampling parameter. The model considers the tokens with top_p probability mass.
Default: 1Min: 0Max: 1
streamboolean
If set to true, partial message deltas will be sent as server-sent events.
Default: false
stoparray[string]
Up to 4 sequences where the API will stop generating further tokens.
frequency_penaltynumber
Penalizes new tokens based on their existing frequency in the text so far. Between -2.0 and 2.0.
Default: 0Min: -2Max: 2
presence_penaltynumber
Penalizes new tokens based on whether they appear in the text so far. Between -2.0 and 2.0.
Default: 0Min: -2Max: 2

Exemplo de corpo da solicitação

json
{
  "model": "kwaipilot/kat-coder-pro-v2",
  "messages": [
    {
      "role": "user",
      "content": "Hello"
    }
  ],
  "max_tokens": 1024,
  "temperature": 0.7,
  "stream": false
}

Schema de saída

A API retorna uma resposta compatível com ChatCompletion.

idstringrequired
Unique identifier for the completion.
objectstringrequired
Object type, always "chat.completion".
Default: "chat.completion"
createdintegerrequired
Unix timestamp of when the completion was created.
modelstringrequired
The model used for the completion.
choicesarray[object]required
List of completion choices.
indexintegerrequired
Index of the choice.
messageobjectrequired
The generated message.
finish_reasonstringrequired
The reason generation stopped.
stoplengthcontent_filter
usageobjectrequired
Token usage statistics.
prompt_tokensintegerrequired
Number of tokens in the prompt.
completion_tokensintegerrequired
Number of tokens in the completion.
total_tokensintegerrequired
Total tokens used.

Exemplo de resposta

json
{
  "id": "chatcmpl-abc123",
  "object": "chat.completion",
  "created": 1700000000,
  "model": "model-name",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "Hello! How can I assist you today?"
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 10,
    "completion_tokens": 20,
    "total_tokens": 30
  }
}

Atlas Cloud Skills

O Atlas Cloud Skills integra mais de 300 modelos de IA diretamente no seu assistente de codificação com IA. Um comando para instalar e depois use linguagem natural para gerar imagens, vídeos e conversar com LLM.

Clientes compatíveis

Claude Code
OpenAI Codex
Gemini CLI
Cursor
Windsurf
VS Code
Trae
GitHub Copilot
Cline
Roo Code
Amp
Goose
Replit
40+ clientes compatíveis

Instalar

bash
npx skills add AtlasCloudAI/atlas-cloud-skills

Configurar chave de API

Obtenha sua chave de API no painel do Atlas Cloud e defina-a como variável de ambiente.

bash
export ATLASCLOUD_API_KEY="your-api-key-here"

Funcionalidades

Após a instalação, você pode usar linguagem natural no seu assistente de IA para acessar todos os modelos do Atlas Cloud.

Geração de imagensGere imagens com modelos como Nano Banana 2, Z-Image e mais.
Criação de vídeosCrie vídeos a partir de texto ou imagens com Kling, Vidu, Veo, etc.
Chat com LLMConverse com Qwen, DeepSeek e outros modelos de linguagem de grande escala.
Upload de mídiaEnvie arquivos locais para fluxos de trabalho de edição de imagens e imagem para vídeo.

MCP Server

O Atlas Cloud MCP Server conecta seu IDE com mais de 300 modelos de IA através do Model Context Protocol. Funciona com qualquer cliente compatível com MCP.

Clientes compatíveis

Cursor
VS Code
Windsurf
Claude Code
OpenAI Codex
Gemini CLI
Cline
Roo Code
100+ clientes compatíveis

Instalar

bash
npx -y atlascloud-mcp

Configuração

Adicione a seguinte configuração ao arquivo de configuração de MCP do seu IDE.

json
{
  "mcpServers": {
    "atlascloud": {
      "command": "npx",
      "args": [
        "-y",
        "atlascloud-mcp"
      ],
      "env": {
        "ATLASCLOUD_API_KEY": "your-api-key-here"
      }
    }
  }
}

Ferramentas disponíveis

atlas_generate_imageGere imagens a partir de prompts de texto.
atlas_generate_videoCrie vídeos a partir de texto ou imagens.
atlas_chatConverse com modelos de linguagem de grande escala.
atlas_list_modelsExplore mais de 300 modelos de IA disponíveis.
atlas_quick_generateCriação de conteúdo em uma etapa com seleção automática de modelo.
atlas_upload_mediaEnvie arquivos locais para fluxos de trabalho de API.
Codificação IA de Elite

KAT-Coder: Geração de Código IA de Elite

73,4% SWE-Bench Verified - Superando Líderes da Indústria

KAT-Coder é o modelo de codificação IA de código fechado principal da Kwaipilot (divisão de pesquisa de IA da Kuaishou), representando o ápice da tecnologia de geração de código agêntico. Alimentado por uma arquitetura Mixture-of-Experts com 72 bilhões de parâmetros ativos e treinado através de aprendizado por reforço agêntico em grande escala, KAT-Coder alcança 73,4% no SWE-Bench Verified, classificando-se entre os melhores modelos de geração de código globalmente ao lado do GPT-5 High e Claude Sonnet 4.5.

73.4%
Pontuação SWE-Bench Verificada
256K
Janela de Contexto
72B
Parâmetros Ativos

Desempenho Líder da Indústria

KAT-Coder compete com os melhores modelos de geração de código do mundo no SWE-Bench Verified, o benchmark padrão da indústria para tarefas de engenharia de software do mundo real

🥇
Claude Sonnet 4.5
77.2%
🥈
GPT-5 High
74.9%
🥉
KAT-Coder Pro
73.4%
* Baseado em pontuações do benchmark SWE-Bench Verified. O desempenho pode variar em diferentes tarefas de geração de código.

Capacidades Principais

Arquitetura Mixture-of-Experts

Aproveita design MoE avançado com 72 bilhões de parâmetros ativos de mais de 1 trilhão no total, oferecendo desempenho de ponta em tarefas complexas de engenharia de software.

  • 72 bilhões de parâmetros ativos para eficiência ideal
  • Construído sobre a família de modelos Qwen
  • Otimizado para bases de código em escala empresarial

Aprendizado por Reforço Agêntico

Treinado através de pipeline multi-estágio incluindo RL agêntico em grande escala, permitindo conclusão autônoma de tarefas complexas de engenharia de software.

  • Otimização de trajetória de prefixo compartilhado
  • Mecanismo de vantagem de modelagem de entropia
  • Treinamento em commits e PRs reais do Git

Integração Multi-Ferramentas

Capacidades integradas para interagir com milhares de ferramentas através de dados de execução reais em sandbox, permitindo fluxos de trabalho práticos de desenvolvimento de software.

  • Dados de interação de milhares de ferramentas
  • Execução real em ambientes sandbox
  • Integração perfeita de API e CLI

Janela de Contexto de 256K

Suporte extenso de contexto permite lidar com interações de codificação sofisticadas de múltiplos turnos e gerenciar bases de código em grande escala efetivamente.

  • Lidar com vários arquivos simultaneamente
  • Manter histórico conversacional longo
  • Raciocínio e refatoração entre arquivos

Treinamento Nativo em Git

Treinado em dados reais de commits e PRs do Git de repositórios empresariais, compreendendo nativamente fluxos de trabalho de controle de versão.

  • Padrões de commits de repositórios reais
  • Melhores práticas de pull request
  • Padrões de revisão de código e colaboração

Qualidade de Nível Empresarial

Dados específicos de domínio de alta qualidade incluindo seguimento de instruções em mais de 30 categorias e capacidades de raciocínio geral.

  • Mais de 30 categorias de seguimento de instruções
  • Raciocínio avançado para casos extremos
  • Geração de código pronta para produção

Pipeline de Treinamento Multi-Estágio

A metodologia de treinamento do KAT-Coder representa um avanço significativo em modelos de codificação IA, combinando vários estágios de treinamento para desempenho ideal

01

Treinamento Intermediário

Estágio fundamental com injeção de conhecimento de codificação e dados específicos de domínio de alta qualidade

02

Ajuste Fino Supervisionado (SFT)

Seguimento de instruções e treinamento de diálogo em mais de 30 categorias

03

Ajuste Fino por Reforço (RFT)

Capacidades aprimoradas de raciocínio e resolução de problemas

04

Aprendizado por Reforço Agêntico

RL em grande escala em bases de código empresariais com conclusão autônoma de tarefas

Perfeito Para

🐛

Depuração Complexa

Identificar e corrigir bugs em grandes bases de código com compreensão de contexto multi-arquivo

🔧

Refatoração de Grandes Bases de Código

Refatoração sistemática com consciência de padrões arquiteturais e dependências

📝

Geração de Código Multi-Arquivo

Gerar código coerente em vários arquivos com integração adequada

📚

Compreensão de Repositório

Analisar e compreender grandes repositórios com insights arquiteturais profundos

Especificações Técnicas

arquiteturaMixture-of-Experts (MoE)
parâmetros_ativos~72 bilhões
parâmetros_totais>1 trilhão
janela_de_contexto256.000 tokens
modelo_baseFamília Qwen
uso_de_ferramentasMilhares de ferramentas
diálogo_multi_turnoCentenas de turnos
categorias_de_instrucoesMais de 30 categorias
licençaCódigo fechado (Comercial)
variantes_open_sourceKAT-Dev-32B, KAT-Dev-72B-Exp

Variantes Open Source

Embora o KAT-Coder Pro seja de código fechado, a Kwaipilot lançou alternativas open source disponíveis no HuggingFace sob licença Apache-2.0

KAT-Dev-32B

Open Source

Variante otimizada de 32 bilhões de parâmetros com treinamento multi-estágio incluindo ajuste fino supervisionado e aprendizado por reforço.

Licença Apache-2.0 para uso comercial
Disponível no HuggingFace
Desempenho pronto para produção

KAT-Dev-72B-Exp

Experimental

Variante experimental de 72 bilhões de parâmetros expandindo os limites das capacidades de geração de código open source.

Modelo maior para tarefas complexas
Capacidades de raciocínio avançadas
Uso em pesquisa e produção

Experimente Geração de Código de Elite

Comece a usar KAT-Coder hoje através da nossa API. Junte-se a desenvolvedores em todo o mundo que confiam no KAT-Coder para tarefas críticas de engenharia de software.

Pontuação líder da indústria de 73,4% no SWE-Bench
256K de contexto para grandes bases de código
Suporte de integração multi-ferramentas

Mais de 300 Modelos, Comece Agora,

Explorar Todos os Modelos