Moonshot AI Models on AtlasCloud | Kimi

Atlas Cloud héberge la gamme complète Kimi via la MoonshotAI API, de K2-Thinking pour le raisonnement profond à K2.6 pour le codage par agent. Le tout facturé à l'usage, avec un contexte de 262K.

Large Language Models by Moonshot AI

Propulsez le chat, le raisonnement et les agents à grande échelle avec les meilleurs grands modèles de langage, servis rapidement et à moindre coût sur Atlas Cloud.

Voir tous les modèles

LLM

Kimi

L’API Kimi est la gamme K2 à poids ouverts de Moonshot AI, du K2.5 nativement multimodal au K2.7 Code spécialisé dans le codage. Comme la vision est intégrée au modèle, vous pouvez transformer des captures d’écran, des maquettes d’interface utilisateur et de courtes vidéos en code frontend fonctionnel, coordonner jusqu’à 100 sous-agents parallèles et raisonner sur un contexte de 256K tokens. Atlas Cloud propose toute la famille via un endpoint unifié, avec une tarification transparente à l’usage. Commencez à développer dès aujourd’hui.

4 modèlesExplorer Kimi

Moonshot AI Models API Pricing Details

Compare standard vs. our pricing across every Moonshot AI model.

Model	Standard Price (USD)	Our Price (USD)	Discount
Kimi K3	$3/$15per 1M tokens1048.6K context	$3/$15M in/outper 1M tokens1048.6K context	—	View
Kimi K2.7 Code	$0.95/$4per 1M tokens262.1K context	$0.95/$4M in/outper 1M tokens262.1K context	—	View
Kimi K2.6	$0.95/$4per 1M tokens262.1K context	$0.95/$4M in/outper 1M tokens262.1K context	—	View
Kimi K2.5	$0.6/$3per 1M tokens262.1K context	$0.49/$2.5M in/outper 1M tokens262.1K context	—	View

Explore models from other providers

Instantly explore and experiment with 400+ production-ready models in the Atlas Playground. Start customizing with one click.

xAI

Cas d'utilisation de l'API Moonshot AI que vous pouvez développer sur Atlas Cloud

L'essaim d'agents et les capacités d'exécution à long terme de Kimi permettent aux équipes d'exécuter des tâches qui nécessiteraient des jours d'efforts humains en une seule session automatisée. Les équipes utilisent la série M en conjonction avec K2-Thinking pour tout couvrir, des modifications de code autonomes à la recherche multi-documents à grande échelle.

Modernisation de la Base de Code Héritée

Les équipes d'ingénierie utilisent Kimi K2.6 pour exécuter des agents de codage à long terme qui remanient de manière autonome les bases de code de production lors de sessions prolongées de plusieurs heures. Dans un exemple documenté, K2.6 a réécrit un moteur d'appariement financier vieux de 8 ans en 13 heures et a permis d'améliorer le débit de 185 % sans intervention humaine entre les validations (commits). La tarification à l'usage d'Atlas Cloud rend pratique l'exécution de ces sessions prolongées d'agents sans engagement de capacité.

Traitement parallèle de documents par lots

Les équipes opérationnelles utilisent l'essaim de 300 agents de Kimi K2.6 pour traiter de grands lots de documents en parallèle. Une seule exécution d'orchestration a mis en correspondance un CV avec 100 rôles professionnels et a produit en sortie 100 CV entièrement personnalisés. Le même modèle s'applique à l'examen de contrats, aux contrôles de conformité et à tout flux de travail où une entrée fixe doit être évaluée par rapport à un grand ensemble variable de cibles.

Raisonnement Profond pour l'Analyse Complexe

Les équipes de recherche et juridiques utilisent Kimi K2-Thinking pour des problèmes d'analyse en plusieurs étapes nécessitant un raisonnement interne prolongado. Le modèle prend en charge jusqu'à 200 à 300 appels d'outils séquentiels par session, bouclant sur des cycles raisonnement-appel-raisonnement sans intervention humaine entre les étapes. Sur Atlas Cloud, son prix est de 0,6 $ par million de tokens en entrée et il partage la fenêtre de contexte de 262K avec le reste de la gamme Kimi.

Production automatisée d'articles de recherche

Les équipes académiques et de contenu utilisent Kimi K2.6 pour transformer les documents sources en résultats de recherche complets. Lors d'une démonstration, K2.6 a converti un article d'astrophysique en un article de recherche de 40 pages, un ensemble de données structuré contenant plus de 20 000 entrées et 14 graphiques de niveau astronomique en une seule session. Cela réduit le délai d'exécution des flux de travail de la littérature aux résultats de plusieurs semaines à quelques heures.

Prospection Commerciale à Grande Échelle

Les équipes de croissance et de vente utilisent les essaims Kimi K2.6 pour identifier des prospects et générer des ressources de prospection en parallèle. Une exécution d'exemple a identifié 30 magasins de détail dans une ville cible sans sites Web et a généré une page de destination pour chacun d'eux. Le même modèle fonctionne pour l'enrichissement des pistes, la cartographie du paysage concurrentiel et toute tâche combinant la découverte et la génération de contenu à l'échelle d'une liste.

Analyse Visuelle de Documents et de Code

Les équipes produit et données utilisent les capacités de vision natives de Kimi K2.5 et K2.6 pour traiter les entrées d'images et de vidéos aux côtés du texte dans le même appel API. L'encodeur MoonViT gère les diagrammes, les captures d'écran, les maquettes d'interface utilisateur (UI) et les numérisations de documents sans prétraitement externe. Cela est utile pour les pipelines qui convertissent directement les spécifications visuelles en code, ou extraient des données structurées à partir de documents riches en images.

Concrétisez la vision de votre entreprise avec Atlas Cloud AI.

Contacter les ventes

Foire aux questions sur les modèles Moonshot AI

Kimi K2.6 is MoonshotAI's latest open-source multimodal LLM, released in April 2026 under a Modified MIT license. It runs a Mixture-of-Experts architecture with 1 trillion total parameters and 32 billion active during inference. It is designed for agentic coding, long-horizon task execution, and multi-agent swarm orchestration.

Kimi K2.6 évolue jusqu'à 300 sous-agents exécutant jusqu'à 4 000 étapes coordonnées en une seule exécution. Kimi K2.5 sur Atlas Cloud prend en charge l'exécution en essaim avec jusqu'à 100 sous-agents. Les tâches sont décomposées dynamiquement en sous-tâches parallèles, spécialisées par domaine, pour une production totalement autonome.

Kimi K2-Thinking utilise un raisonnement profond par chaîne de pensée avec jusqu'à 200 à 300 appels d'outils séquentiels par session. Le modèle raisonne, appelle un outil, interprète le résultat, appelle un autre outil et poursuit cette boucle sans intervention humaine. Il est adapté à l'inférence logique en plusieurs étapes, aux mathématiques complexes et aux problèmes où un raisonnement interne étendu améliore la précision.

Oui. Kimi K2.5 et K2.6 incluent MoonViT, un encodeur de vision de 400 millions de paramètres qui traite nativement les images et les vidéos. Vous pouvez passer des entrées d'image ou de vidéo directement dans l'appel API avec le texte sans prétraitement externe. Cela prend en charge les flux de travail d'analyse visuelle, de compréhension de documents et de génération d'image en code.

Oui. Kimi K2.6 est publié sous une licence MIT modifiée, qui autorise une utilisation commerciale. Les poids ouverts sont disponibles sur HuggingFace pour les déploiements auto-hébergés. Atlas Cloud propose également K2.6 via une API pour les équipes qui préfèrent un accès géré sans frais généraux d'infrastructure.

Kimi K2.6 obtient un score de 80,2 % sur SWE-Bench Verified et de 54,0 % sur Humanity's Last Exam avec des outils, surpassant GPT-5.5 sur ces deux benchmarks. Il est également en tête sur BrowseComp avec 83,2 %, devant GPT-5.4. Ces résultats sont obtenus à un coût par million de tokens environ 80 % inférieur à celui de GPT-5.5.

Le prix de Kimi K2.5 est de 0,49 $ par million de tokens d'entrée et de 2,5 $ par million de tokens de sortie sur Atlas Cloud. Kimi K2-Thinking et K2-Instruct-0905 fonctionnent à 0,6 $ par million de tokens d'entrée avec le même tarif de sortie. Consultez la page du modèle Kimi K2.6 sur Atlas Cloud pour connaître ses tarifs spécifiques actuels.

Explorer Plus de Familles

Seedance 2.0

L'API Seedance 2.0 vous donne un accès en production au modèle vidéo multimodal de ByteDance — des entrées quadrimodales (texte, image, vidéo, audio) et un système « Universal Reference » leader du secteur qui verrouille la composition, les mouvements de caméra et les actions des personnages à travers les plans. Intégrez un contrôle de niveau réalisateur avec un seul appel d'API, un tarif fixe de 0,09 $/s, une clé instantanée et aucune liste d'attente — le tout soutenu par une disponibilité et une conformité de niveau entreprise. Seedance 2.0 Native 4K est désormais disponible !

Voir la Famille

Grok Imagine

La Grok Imagine API offre aux développeurs la génération d'images, de vidéos et d'audio de xAI dans une seule suite. Elle produit des images jusqu'à 2K avec un rendu de texte multilingue, ainsi que des vidéos allant jusqu'à 15 secondes avec un audio natif synchronisé et une édition basée sur des références. Sur Atlas Cloud, une seule clé exécute chaque mode Grok Imagine, ce qui vous permet de passer d'une image, d'une vidéo et d'un audio à l'autre sans configuration distincte, à partir de 0,02 $ par image et 0,05 $ par seconde.

Voir la Famille

Gemini Omni Flash

La Gemini Omni API apporte à votre stack le modèle multimodal de génération et d'édition vidéo de Google DeepMind, présenté à Google I/O 2026. Gemini Omni fusionne le moteur de raisonnement de Gemini avec les médias génératifs : il accepte n'importe quelle combinaison de texte, d'images, de vidéo et d'audio pour produire des résultats cohérents et ancrés dans la connaissance. Affinez vos résultats par simple conversation — remplacez des objets, réécrivez des scènes, changez de style — tandis que la physique, les personnages et la continuité restent intacts. Atlas Cloud propose toute la gamme Gemini Omni Flash — texte vers vidéo, image vers vidéo avec jusqu'à 7 images de référence, et référence vers vidéo — via une API unifiée, avec une tarification transparente à la seconde à partir de $0.112 et sans abonnement. Commencez à développer dès aujourd'hui.

Voir la Famille

GPT Image 2

L'API GPT Image 2 offre aux développeurs un accès au dernier modèle d'image d'OpenAI, le successeur de GPT Image 1.5. Elle génère et modifie des images avec un rendu de texte précis pour les caractères latins et CJK, ainsi qu'une composition solide pour les affiches, les maquettes et les infographies. Sur Atlas Cloud, vous y accédez via une API unifiée aux côtés de plus de 300 modèles, avec des crédits gratuits, une disponibilité de 99,99 % et sans aucune vérification d'organisation OpenAI requise.

Voir la Famille

Google

Les modèles créatifs les plus puissants de Google sont tous disponibles sur Atlas Cloud. Veo 3.1 offre une génération de vidéos cinématographiques, Nano Banana 2 permet de créer des images haute fidélité, et Gemini apporte une intelligence multimodale à chaque flux de travail. Accédez à la suite complète de modèles Google via une seule API key avec une disponibilité Day-0 et une tarification à l'usage (pay-as-you-go).

Voir la Famille

Seedance 2.0 Mini

Seedance 2.0 Mini apporte la génération de vidéos multimodale de ByteDance aux flux de travail où la vitesse et les coûts sont primordiaux. Il offre les capacités de base de Seedance 2.0 avec une empreinte plus légère — une génération plus rapide, un coût par vidéo réduit et la même intégration API que celle que vous utilisez déjà. Pour les équipes qui gèrent des pipelines à haut volume ou du prototypage à grande échelle, Mini est le choix par défaut pratique.

Voir la Famille

ByteDance

De la génération de vidéos cinématiques à la création d'images haute fidélité, les modèles les plus puissants de ByteDance sont disponibles sur Atlas Cloud. Exécutez Seedance et Seedream à grande échelle avec les prix d'inférence les plus bas et aucune surcharge d'infrastructure.

Voir la Famille

Alibaba

Atlas Cloud rassemble l'ensemble de la gamme de modèles d'Alibaba sous une seule API : Qwen pour les tâches linguistiques et d'imagerie, et Wan pour la génération de vidéos jusqu'en 1080p. Accédez à chaque modèle avec une tarification à l'usage (pay-as-you-go) sans abonnement. L'API Alibaba est disponible via une URL de base unique en utilisant votre client existant compatible avec OpenAI.

Voir la Famille

OpenAI

Atlas Cloud vous donne accès à l'ensemble de la gamme de l'API OpenAI, de GPT Image 2 pour la génération d'images à Sora 2 pour la vidéo. Chaque modèle est disponible en paiement à l'usage sans engagement mensuel. Intégrez-le en remplaçant simplement l'URL de base à l'aide de l'API compatible OpenAI.

Voir la Famille

xAI

Créez des pipelines complets d'images et de vidéos en utilisant la xAI API sur Atlas Cloud. Générez en 2K, éditez avec des images de référence et animez des images en clips synchronisés avec l'audio.

Voir la Famille

Kwaivgi

L'API Kwaivgi à 15 % en dessous du tarif standard. Atlas Cloud offre un accès Day-0 aux nouvelles versions de Kling avec une tarification à l'usage et sans limite de postes. Un seul compte, une seule clé, tous les modèles Kling du niveau standard au niveau master.

Voir la Famille

Seedream 5.0 Pro

L'API Seedream 5.0 Pro offre aux développeurs le modèle d'édition d'images contrôlable de ByteDance sur Atlas Cloud. Elle positionne les modifications avec précision à l'aide d'ancrages et de coordonnées, sépare les images en calques modifiables, fusionne de multiples références et fait correspondre les couleurs et matériaux exacts, avec du texte multilingue en 2K et 3K. Sur Atlas Cloud, vous y accédez via une seule clé !

Voir la Famille