Moonshot AI Models on AtlasCloud | Kimi

Atlas Cloud héberge la gamme complète Kimi via la MoonshotAI API, de K2-Thinking pour le raisonnement profond à K2.6 pour le codage par agent. Le tout facturé à l'usage, avec un contexte de 262K.

Large Language Models by Moonshot AI

Propulsez le chat, le raisonnement et les agents à grande échelle avec les meilleurs grands modèles de langage, servis rapidement et à moindre coût sur Atlas Cloud.

Voir tous les modèles

Moonshot AI Models API Pricing Details

Compare standard vs. our pricing across every Moonshot AI model.

ModelStandard Price (USD)Our Price (USD)Discount
Kimi K2.5
$0.6/$3per 1M tokens262.1K context
$0.49/$2.5M in/outper 1M tokens262.1K context
View
Kimi-K2-Thinking
$0.6/$2.5per 1M tokens262.1K context
$0.6/$2.5M in/outper 1M tokens262.1K context
View
Kimi-K2-Instruct-0905
$0.6/$2.5per 1M tokens262.1K context
$0.6/$2.5M in/outper 1M tokens262.1K context
View
Kimi-K2-Instruct
$0.6/$2.5per 1M tokens131.1K context
$0.7/$2.5M in/outper 1M tokens131.1K context
View

Explore models from other providers

Instantly explore and experiment with 300+ production-ready models in the Atlas Playground. Start customizing with one click.

Cas d'utilisation de l'API Moonshot AI que vous pouvez développer sur Atlas Cloud

L'essaim d'agents et les capacités d'exécution à long terme de Kimi permettent aux équipes d'exécuter des tâches qui nécessiteraient des jours d'efforts humains en une seule session automatisée. Les équipes utilisent la série M en conjonction avec K2-Thinking pour tout couvrir, des modifications de code autonomes à la recherche multi-documents à grande échelle.

Modernisation de la Base de Code Héritée

Les équipes d'ingénierie utilisent Kimi K2.6 pour exécuter des agents de codage à long terme qui remanient de manière autonome les bases de code de production lors de sessions prolongées de plusieurs heures. Dans un exemple documenté, K2.6 a réécrit un moteur d'appariement financier vieux de 8 ans en 13 heures et a permis d'améliorer le débit de 185 % sans intervention humaine entre les validations (commits). La tarification à l'usage d'Atlas Cloud rend pratique l'exécution de ces sessions prolongées d'agents sans engagement de capacité.

Traitement parallèle de documents par lots

Les équipes opérationnelles utilisent l'essaim de 300 agents de Kimi K2.6 pour traiter de grands lots de documents en parallèle. Une seule exécution d'orchestration a mis en correspondance un CV avec 100 rôles professionnels et a produit en sortie 100 CV entièrement personnalisés. Le même modèle s'applique à l'examen de contrats, aux contrôles de conformité et à tout flux de travail où une entrée fixe doit être évaluée par rapport à un grand ensemble variable de cibles.

Raisonnement Profond pour l'Analyse Complexe

Les équipes de recherche et juridiques utilisent Kimi K2-Thinking pour des problèmes d'analyse en plusieurs étapes nécessitant un raisonnement interne prolongado. Le modèle prend en charge jusqu'à 200 à 300 appels d'outils séquentiels par session, bouclant sur des cycles raisonnement-appel-raisonnement sans intervention humaine entre les étapes. Sur Atlas Cloud, son prix est de 0,6 $ par million de tokens en entrée et il partage la fenêtre de contexte de 262K avec le reste de la gamme Kimi.

Production automatisée d'articles de recherche

Les équipes académiques et de contenu utilisent Kimi K2.6 pour transformer les documents sources en résultats de recherche complets. Lors d'une démonstration, K2.6 a converti un article d'astrophysique en un article de recherche de 40 pages, un ensemble de données structuré contenant plus de 20 000 entrées et 14 graphiques de niveau astronomique en une seule session. Cela réduit le délai d'exécution des flux de travail de la littérature aux résultats de plusieurs semaines à quelques heures.

Prospection Commerciale à Grande Échelle

Les équipes de croissance et de vente utilisent les essaims Kimi K2.6 pour identifier des prospects et générer des ressources de prospection en parallèle. Une exécution d'exemple a identifié 30 magasins de détail dans une ville cible sans sites Web et a généré une page de destination pour chacun d'eux. Le même modèle fonctionne pour l'enrichissement des pistes, la cartographie du paysage concurrentiel et toute tâche combinant la découverte et la génération de contenu à l'échelle d'une liste.

Analyse Visuelle de Documents et de Code

Les équipes produit et données utilisent les capacités de vision natives de Kimi K2.5 et K2.6 pour traiter les entrées d'images et de vidéos aux côtés du texte dans le même appel API. L'encodeur MoonViT gère les diagrammes, les captures d'écran, les maquettes d'interface utilisateur (UI) et les numérisations de documents sans prétraitement externe. Cela est utile pour les pipelines qui convertissent directement les spécifications visuelles en code, ou extraient des données structurées à partir de documents riches en images.

Concrétisez la vision de votre entreprise avec Atlas Cloud AI.

Contacter les ventes

Foire aux questions sur les modèles Moonshot AI

Kimi K2.6 is MoonshotAI's latest open-source multimodal LLM, released in April 2026 under a Modified MIT license. It runs a Mixture-of-Experts architecture with 1 trillion total parameters and 32 billion active during inference. It is designed for agentic coding, long-horizon task execution, and multi-agent swarm orchestration.

Kimi K2.6 évolue jusqu'à 300 sous-agents exécutant jusqu'à 4 000 étapes coordonnées en une seule exécution. Kimi K2.5 sur Atlas Cloud prend en charge l'exécution en essaim avec jusqu'à 100 sous-agents. Les tâches sont décomposées dynamiquement en sous-tâches parallèles, spécialisées par domaine, pour une production totalement autonome.

Kimi K2-Thinking utilise un raisonnement profond par chaîne de pensée avec jusqu'à 200 à 300 appels d'outils séquentiels par session. Le modèle raisonne, appelle un outil, interprète le résultat, appelle un autre outil et poursuit cette boucle sans intervention humaine. Il est adapté à l'inférence logique en plusieurs étapes, aux mathématiques complexes et aux problèmes où un raisonnement interne étendu améliore la précision.

Oui. Kimi K2.5 et K2.6 incluent MoonViT, un encodeur de vision de 400 millions de paramètres qui traite nativement les images et les vidéos. Vous pouvez passer des entrées d'image ou de vidéo directement dans l'appel API avec le texte sans prétraitement externe. Cela prend en charge les flux de travail d'analyse visuelle, de compréhension de documents et de génération d'image en code.

Oui. Kimi K2.6 est publié sous une licence MIT modifiée, qui autorise une utilisation commerciale. Les poids ouverts sont disponibles sur HuggingFace pour les déploiements auto-hébergés. Atlas Cloud propose également K2.6 via une API pour les équipes qui préfèrent un accès géré sans frais généraux d'infrastructure.

Kimi K2.6 obtient un score de 80,2 % sur SWE-Bench Verified et de 54,0 % sur Humanity's Last Exam avec des outils, surpassant GPT-5.5 sur ces deux benchmarks. Il est également en tête sur BrowseComp avec 83,2 %, devant GPT-5.4. Ces résultats sont obtenus à un coût par million de tokens environ 80 % inférieur à celui de GPT-5.5.

Le prix de Kimi K2.5 est de 0,49 $ par million de tokens d'entrée et de 2,5 $ par million de tokens de sortie sur Atlas Cloud. Kimi K2-Thinking et K2-Instruct-0905 fonctionnent à 0,6 $ par million de tokens d'entrée avec le même tarif de sortie. Consultez la page du modèle Kimi K2.6 sur Atlas Cloud pour connaître ses tarifs spécifiques actuels.

Explorer Plus de Familles

Seedance 2.0 Models

Seedance 2.0(by Bytedance) is a multimodal video generation model that redefines "controllable creation," moving beyond the limitations of text or start/end frames. It supports quad-modal inputs—text, image, video, and audio—and introduces an industry-leading "Universal Reference" system. By precisely replicating the composition, camera movement, and character actions from reference assets, Seedance 2.0 solves critical issues with character consistency and physical coherence, empowering creators to act as true "directors" with deep control over their output.

Voir la Famille

Grok-Imagine Models

Grok Imagine Image Quality is xAI's latest AI image generation model, delivering studio-grade visuals with up to 2K resolution and razor-sharp detail. It offers best-in-class text rendering across multiple languages, photorealistic outputs with natural lighting, rich textures, and believable physics, plus tighter prompt following and image editing with reference inputs for precise creative control. Ideal for hero images, ad creatives, product renders, and brand-grade visuals.

Voir la Famille

Gemini Omni

Gemini Omni (by Google DeepMind) is a video generation and editing model launched on May 20, 2026 at Google I/O that redefines the standard for "reasoning-driven creation," built specifically to solve the core challenge of AI video: making output that actually understands what you mean, not just what you type. It fuses Gemini's reasoning engine with generative capability, accepting any mix of images, text, video, and audio to produce consistent, knowledge-grounded output. Unlike models that start from scratch each time, Omni lets you edit through natural conversation — swapping objects, rewriting scenes, shifting styles — while keeping physics, characters, and continuity intact across every turn.

Voir la Famille

GPT Image 2 Models

GPT Image 2 is a state-of-the-art multimodal foundation model engineered for exceptional text-to-image generation with unprecedented photorealism and creative versatility. Developed by OpenAI as the evolution of the DALL-E lineage, it transforms detailed natural language descriptions into hyper-realistic imagery at up to 4K resolution. With proprietary "Neural Rendering Engine" technology for precise visual control, GPT Image 2 delivers studio-quality results with accurate anatomy, lighting, and composition—making it the premier AI tool for professional creators, enterprises, and developers demanding production-ready visual assets.

Voir la Famille

Google Models on Atlas Cloud | Gemini, Nano Bananas & Veo

Les modèles créatifs les plus puissants de Google sont tous disponibles sur Atlas Cloud. Veo 3.1 offre une génération de vidéos cinématographiques, Nano Banana 2 permet de créer des images haute fidélité, et Gemini apporte une intelligence multimodale à chaque flux de travail. Accédez à la suite complète de modèles Google via une seule API key avec une disponibilité Day-0 et une tarification à l'usage (pay-as-you-go).

Voir la Famille

ByteDance Models on Atlas Cloud | Seedance & Seedream

De la génération de vidéos cinématiques à la création d'images haute fidélité, les modèles les plus puissants de ByteDance sont disponibles sur Atlas Cloud. Exécutez Seedance et Seedream à grande échelle avec les prix d'inférence les plus bas et aucune surcharge d'infrastructure.

Voir la Famille

Alibaba Models on Atlas Cloud | Wan & Qwen

Atlas Cloud rassemble l'ensemble de la gamme de modèles d'Alibaba sous une seule API : Qwen pour les tâches linguistiques et d'imagerie, et Wan pour la génération de vidéos jusqu'en 1080p. Accédez à chaque modèle avec une tarification à l'usage (pay-as-you-go) sans abonnement. L'API Alibaba est disponible via une URL de base unique en utilisant votre client existant compatible avec OpenAI.

Voir la Famille

MAI Image 2.5 Models

MAI-Image-2.5 est la dernière famille de modèles de génération et d'édition d'images photoréalistes de Microsoft, conçue pour le design commercial, la photographie de produits et la création de contenu prêt pour les marques. Disponible dans les variantes standard et Flash pour la génération de texte en image et l'édition d'images, il offre les meilleurs scores Arena ELO de sa catégorie à des prix compétitifs, à partir de 0,03 $ par image. Avec un rendu de texte précis, une capacité d'édition chirurgicale et une génération de portraits naturels, MAI-Image-2.5 est conçu pour les équipes qui ont besoin de visuels de qualité de production sans les frais généraux de post-traitement.

Voir la Famille

Wan2.7 Models

Launching this March, Wan2.7 is the latest powerhouse in the Qwen ecosystem, delivering a massive upgrade in visual fidelity, audio synchronization, and motion consistency over version 2.6. This all-in-one AI video generator supports advanced features like first-and-last frame control, 3x3 grid synthesis, and instruction-based video editing. Outperforming competitors like Jimeng, Wan2.7 offers superior flexibility with support for real-person image inputs, up to five video references, and 1080P high-definition outputs spanning 2 to 15 seconds, making it the premier choice for professional digital storytelling and high-end content marketing.

Voir la Famille

Nano Banana2 Models

Nano Banana 2 (by Google), is a generative image model that perfectly balances lightning-fast rendering with exceptional visual quality. With an improved price-performance ratio, it achieves breakthrough micro-detail depiction, accurate native text rendering, and complex physical structure reconstruction. It serves as a highly efficient, commercial-grade visual production tool for developers, marketing teams, and content creators.

Voir la Famille

Midjourney Models

Midjourney is a proprietary AI image and video generation platform developed by Midjourney, Inc. (San Francisco). Founded in 2021 by David Holz, it has become the aesthetic gold standard in generative AI — transforming text prompts into cinematic, painterly visuals at native 2K resolution. The latest V8.1 architecture, rebuilt from scratch on GPU-native PyTorch, delivers 4–5× faster generation, true 2048×2048 output without upscaling artifacts, and a signature visual style that remains unmatched by competitors. With the addition of Video V1, Midjourney extends its aesthetic into motion — animating still images into atmospheric 5-second cinematic clips. From brand campaigns to film pre-visualization to game concept art, Midjourney is the premier AI creative tool for professionals who demand both speed and artistry.

Voir la Famille

PixVerse Models

PixVerse, developed by AISphere, is a video generation model series built around one idea: giving creators director-level control over every frame. V6 is the flagship generation model, covering text-to-video, image-to-video, reference-to-video, start-and-end frame control, and video extension in a single cohesive pipeline. C1 takes a different approach — it is a storyboard-native model designed for multi-shot narrative production, where scene continuity and visual consistency across clips matter as much as individual frame quality. Both series are available on Atlas Cloud, starting from $0.025 per second, with no infrastructure setup required.

Voir la Famille

Articles recommandés

Guides, tutoriels et actualités produit pour tirer le meilleur d'Atlas Cloud.

Join our Discord community

Join the Discord community for the latest model updates, prompts, and support.