
Atlas Cloud héberge la gamme complète Kimi via la MoonshotAI API, de K2-Thinking pour le raisonnement profond à K2.6 pour le codage par agent. Le tout facturé à l'usage, avec un contexte de 262K.
Propulsez le chat, le raisonnement et les agents à grande échelle avec les meilleurs grands modèles de langage, servis rapidement et à moindre coût sur Atlas Cloud.
Compare standard vs. our pricing across every Moonshot AI model.
| Model | Standard Price (USD) | Our Price (USD) | Discount | |
|---|---|---|---|---|
| Kimi K2.5 | $0.6/$3per 1M tokens262.1K context | $0.49/$2.5M in/outper 1M tokens262.1K context | — | View |
| Kimi-K2-Thinking | $0.6/$2.5per 1M tokens262.1K context | $0.6/$2.5M in/outper 1M tokens262.1K context | — | View |
| Kimi-K2-Instruct-0905 | $0.6/$2.5per 1M tokens262.1K context | $0.6/$2.5M in/outper 1M tokens262.1K context | — | View |
| Kimi-K2-Instruct | $0.6/$2.5per 1M tokens131.1K context | $0.7/$2.5M in/outper 1M tokens131.1K context | — | View |
Instantly explore and experiment with 300+ production-ready models in the Atlas Playground. Start customizing with one click.
L'essaim d'agents et les capacités d'exécution à long terme de Kimi permettent aux équipes d'exécuter des tâches qui nécessiteraient des jours d'efforts humains en une seule session automatisée. Les équipes utilisent la série M en conjonction avec K2-Thinking pour tout couvrir, des modifications de code autonomes à la recherche multi-documents à grande échelle.
Les équipes d'ingénierie utilisent Kimi K2.6 pour exécuter des agents de codage à long terme qui remanient de manière autonome les bases de code de production lors de sessions prolongées de plusieurs heures. Dans un exemple documenté, K2.6 a réécrit un moteur d'appariement financier vieux de 8 ans en 13 heures et a permis d'améliorer le débit de 185 % sans intervention humaine entre les validations (commits). La tarification à l'usage d'Atlas Cloud rend pratique l'exécution de ces sessions prolongées d'agents sans engagement de capacité.
Les équipes opérationnelles utilisent l'essaim de 300 agents de Kimi K2.6 pour traiter de grands lots de documents en parallèle. Une seule exécution d'orchestration a mis en correspondance un CV avec 100 rôles professionnels et a produit en sortie 100 CV entièrement personnalisés. Le même modèle s'applique à l'examen de contrats, aux contrôles de conformité et à tout flux de travail où une entrée fixe doit être évaluée par rapport à un grand ensemble variable de cibles.
Les équipes de recherche et juridiques utilisent Kimi K2-Thinking pour des problèmes d'analyse en plusieurs étapes nécessitant un raisonnement interne prolongado. Le modèle prend en charge jusqu'à 200 à 300 appels d'outils séquentiels par session, bouclant sur des cycles raisonnement-appel-raisonnement sans intervention humaine entre les étapes. Sur Atlas Cloud, son prix est de 0,6 $ par million de tokens en entrée et il partage la fenêtre de contexte de 262K avec le reste de la gamme Kimi.
Les équipes académiques et de contenu utilisent Kimi K2.6 pour transformer les documents sources en résultats de recherche complets. Lors d'une démonstration, K2.6 a converti un article d'astrophysique en un article de recherche de 40 pages, un ensemble de données structuré contenant plus de 20 000 entrées et 14 graphiques de niveau astronomique en une seule session. Cela réduit le délai d'exécution des flux de travail de la littérature aux résultats de plusieurs semaines à quelques heures.
Les équipes de croissance et de vente utilisent les essaims Kimi K2.6 pour identifier des prospects et générer des ressources de prospection en parallèle. Une exécution d'exemple a identifié 30 magasins de détail dans une ville cible sans sites Web et a généré une page de destination pour chacun d'eux. Le même modèle fonctionne pour l'enrichissement des pistes, la cartographie du paysage concurrentiel et toute tâche combinant la découverte et la génération de contenu à l'échelle d'une liste.
Les équipes produit et données utilisent les capacités de vision natives de Kimi K2.5 et K2.6 pour traiter les entrées d'images et de vidéos aux côtés du texte dans le même appel API. L'encodeur MoonViT gère les diagrammes, les captures d'écran, les maquettes d'interface utilisateur (UI) et les numérisations de documents sans prétraitement externe. Cela est utile pour les pipelines qui convertissent directement les spécifications visuelles en code, ou extraient des données structurées à partir de documents riches en images.
Kimi K2.6 is MoonshotAI's latest open-source multimodal LLM, released in April 2026 under a Modified MIT license. It runs a Mixture-of-Experts architecture with 1 trillion total parameters and 32 billion active during inference. It is designed for agentic coding, long-horizon task execution, and multi-agent swarm orchestration.
Kimi K2.6 évolue jusqu'à 300 sous-agents exécutant jusqu'à 4 000 étapes coordonnées en une seule exécution. Kimi K2.5 sur Atlas Cloud prend en charge l'exécution en essaim avec jusqu'à 100 sous-agents. Les tâches sont décomposées dynamiquement en sous-tâches parallèles, spécialisées par domaine, pour une production totalement autonome.
Kimi K2-Thinking utilise un raisonnement profond par chaîne de pensée avec jusqu'à 200 à 300 appels d'outils séquentiels par session. Le modèle raisonne, appelle un outil, interprète le résultat, appelle un autre outil et poursuit cette boucle sans intervention humaine. Il est adapté à l'inférence logique en plusieurs étapes, aux mathématiques complexes et aux problèmes où un raisonnement interne étendu améliore la précision.
Oui. Kimi K2.5 et K2.6 incluent MoonViT, un encodeur de vision de 400 millions de paramètres qui traite nativement les images et les vidéos. Vous pouvez passer des entrées d'image ou de vidéo directement dans l'appel API avec le texte sans prétraitement externe. Cela prend en charge les flux de travail d'analyse visuelle, de compréhension de documents et de génération d'image en code.
Oui. Kimi K2.6 est publié sous une licence MIT modifiée, qui autorise une utilisation commerciale. Les poids ouverts sont disponibles sur HuggingFace pour les déploiements auto-hébergés. Atlas Cloud propose également K2.6 via une API pour les équipes qui préfèrent un accès géré sans frais généraux d'infrastructure.
Kimi K2.6 obtient un score de 80,2 % sur SWE-Bench Verified et de 54,0 % sur Humanity's Last Exam avec des outils, surpassant GPT-5.5 sur ces deux benchmarks. Il est également en tête sur BrowseComp avec 83,2 %, devant GPT-5.4. Ces résultats sont obtenus à un coût par million de tokens environ 80 % inférieur à celui de GPT-5.5.
Le prix de Kimi K2.5 est de 0,49 $ par million de tokens d'entrée et de 2,5 $ par million de tokens de sortie sur Atlas Cloud. Kimi K2-Thinking et K2-Instruct-0905 fonctionnent à 0,6 $ par million de tokens d'entrée avec le même tarif de sortie. Consultez la page du modèle Kimi K2.6 sur Atlas Cloud pour connaître ses tarifs spécifiques actuels.
Guides, tutoriels et actualités produit pour tirer le meilleur d'Atlas Cloud.
Join the Discord community for the latest model updates, prompts, and support.