
Atlas Cloud hostet das gesamte Kimi-Lineup über die MoonshotAI API, von K2-Thinking für tiefgreifendes Schlussfolgern bis hin zu K2.6 für agentenbasiertes Programmieren. Alles nutzungsbasiert (Pay-as-you-go), mit 262K Kontext.
Treiben Sie Chat, Reasoning und Agenten im großen Maßstab mit führenden großen Sprachmodellen an – schnell und kostengünstig bereitgestellt auf Atlas Cloud.
Compare standard vs. our pricing across every Moonshot AI model.
| Model | Standard Price (USD) | Our Price (USD) | Discount | |
|---|---|---|---|---|
| Kimi K2.5 | $0.6/$3per 1M tokens262.1K context | $0.49/$2.5M in/outper 1M tokens262.1K context | — | View |
| Kimi-K2-Thinking | $0.6/$2.5per 1M tokens262.1K context | $0.6/$2.5M in/outper 1M tokens262.1K context | — | View |
| Kimi-K2-Instruct-0905 | $0.6/$2.5per 1M tokens262.1K context | $0.6/$2.5M in/outper 1M tokens262.1K context | — | View |
| Kimi-K2-Instruct | $0.6/$2.5per 1M tokens131.1K context | $0.7/$2.5M in/outper 1M tokens131.1K context | — | View |
Instantly explore and experiment with 300+ production-ready models in the Atlas Playground. Start customizing with one click.
Die Agenten-Schwarm- und Langzeitausführungsfunktionen von Kimi ermöglichen es Teams, Aufgaben, die Tage menschlicher Arbeit in Anspruch nehmen würden, in einer einzigen automatisierten Sitzung auszuführen. Teams nutzen die M-series zusammen mit K2-Thinking, um alles von autonomen Codeänderungen bis hin zu umfassender Multi-Dokumenten-Recherche im großen Maßstab abzudecken.
Engineering-Teams nutzen Kimi K2.6, um langlaufende Coding-Agenten auszuführen, die Produktions-Codebasen in mehrstündigen Sitzungen autonom überarbeiten. In einem dokumentierten Beispiel hat K2.6 eine 8 Jahre alte Finanz-Matching-Engine über 13 Stunden hinweg neu geschrieben und eine Durchsatzsteigerung von 185 % ohne menschliches Eingreifen zwischen den Commits geliefert. Die Pay-as-you-go-Preisgestaltung von Atlas Cloud macht es praktisch möglich, diese ausgedehnten agentischen Sitzungen ohne Kapazitätsverpflichtungen durchzuführen.
Betriebsteams nutzen den 300-Agenten-Schwarm von Kimi K2.6, um große Dokumentenstapel parallel zu verarbeiten. Ein einzelner Orchestrierungslauf glich einen Lebenslauf mit 100 Stellenprofilen ab und lieferte als Ergebnis 100 vollständig angepasste Lebensläufe. Dasselbe Muster gilt für Vertragsprüfungen, Compliance-Prüfungen und jeden Workflow, bei dem eine feste Eingabe gegen eine große, variable Menge von Zielen evaluiert werden muss.
Forschungs- und Rechtsteams nutzen Kimi K2-Thinking für mehrstufige Analyseprobleme, die ein erweitertes internes Schlussfolgern erfordern. Das Modell unterstützt bis zu 200 bis 300 sequentielle Werkzeugaufrufe pro Sitzung und durchläuft dabei Zyklen von Schlussfolgern-Aufrufen-Schlussfolgern (reason-call-reason) ohne menschliche Eingaben zwischen den Schritten. Auf Atlas Cloud kostet es 0,6 $ pro Million Input-Token und teilt sich das 262K-Kontextfenster mit der restlichen Kimi-Produktlinie.
Wissenschafts- und Content-Teams nutzen Kimi K2.6, um Quelldokumente in vollständige Forschungsergebnisse umzuwandeln. In einem Demonstrationslauf wandelte K2.6 in einer einzigen Sitzung ein Astrophysik-Papier in eine 40-seitige Forschungsarbeit, einen strukturierten Datensatz mit über 20.000 Einträgen und 14 astronomietaugliche Diagramme um. Dies reduziert die Durchlaufzeit von Literatur-zu-Ergebnis-Workflows von Wochen auf Stunden.
Wachstums- und Vertriebsteams nutzen Kimi K2.6 Schwärme, um parallel potenzielle Kunden zu identifizieren und Outreach-Ressourcen zu generieren. Ein Beispiellauf identifizierte in einer Zielstadt 30 Einzelhandelsgeschäfte ohne Websites und erstellte für jedes eine Landingpage. Das gleiche Muster funktioniert für die Anreicherung von Leads, die Kartierung der Wettbewerbslandschaft und jede Aufgabe, die Entdeckung und Content-Generierung auf Listenebene kombiniert.
Produkt- und Datenteams nutzen die nativen Vision-Funktionen von Kimi K2.5 und K2.6, um Bild- und Videoeingaben zusammen mit Text im selben API-Aufruf zu verarbeiten. Der MoonViT-Encoder verarbeitet Diagramme, Screenshots, UI-Mockups und Dokumentenscans ohne externe Vorverarbeitung. Dies ist nützlich für Pipelines, die visuelle Spezifikationen direkt in Code umwandeln oder strukturierte Daten aus bildlastigen Dokumenten extrahieren.
Kimi K2.6 is MoonshotAI's latest open-source multimodal LLM, released in April 2026 under a Modified MIT license. It runs a Mixture-of-Experts architecture with 1 trillion total parameters and 32 billion active during inference. It is designed for agentic coding, long-horizon task execution, and multi-agent swarm orchestration.
Kimi K2.6 skaliert auf 300 Sub-Agenten, die in einem einzigen Durchlauf bis zu 4.000 koordinierte Schritte ausführen. Kimi K2.5 auf der Atlas Cloud unterstützt die Schwarm-Ausführung mit bis zu 100 Sub-Agenten. Aufgaben werden dynamisch in parallele, domänenspezifische Teilaufgaben zerlegt, um eine vollautonome Ausgabe zu erzielen.
Kimi K2-Thinking nutzt tiefgehendes Chain-of-Thought-Reasoning mit bis zu 200 bis 300 aufeinanderfolgenden Werkzeugaufrufen pro Sitzung. Das Modell schlussfolgert, ruft ein Werkzeug auf, interpretiert das Ergebnis, ruft ein weiteres Werkzeug auf und setzt diese Schleife ohne menschliches Eingreifen fort. Es eignet sich für mehrstufige logische Inferenz, komplexe Mathematik und Probleme, bei denen ein erweitertes internes Reasoning die Genauigkeit verbessert.
Ja. Kimi K2.5 und K2.6 beinhalten MoonViT, einen Vision-Encoder mit 400 Millionen Parametern, der Bilder und Videos nativ verarbeitet. Sie können Bild- oder Videoeingaben ohne externe Vorverarbeitung direkt im API-Aufruf zusammen mit Text übergeben. Dies unterstützt Workflows für visuelle Analysen, Dokumentenverständnis und Bild-zu-Code-Generierung.
Ja. Kimi K2.6 wird unter einer modifizierten MIT-Lizenz veröffentlicht, die eine kommerzielle Nutzung erlaubt. Offene Gewichtungen sind auf HuggingFace für selbst gehostete Deployments verfügbar. Atlas Cloud bietet K2.6 auch über eine API für Teams an, die einen verwalteten Zugriff ohne Infrastruktur-Overhead bevorzugen.
Kimi K2.6 erreicht 80,2 % bei SWE-Bench Verified und 54,0 % bei Humanity's Last Exam mit Tools und übertrifft damit GPT-5.5 in beiden Benchmarks. Es führt auch bei BrowseComp mit 83,2 % vor GPT-5.4. Diese Ergebnisse werden bei etwa 80 % geringeren Kosten pro Million Tokens im Vergleich zu GPT-5.5 erzielt.
Kimi K2.5 kostet auf Atlas Cloud 0,49 $ pro Million Input-Tokens und 2,5 $ pro Million Output-Tokens. Kimi K2-Thinking und K2-Instruct-0905 laufen für 0,6 $ pro Million Input-Tokens bei gleicher Output-Rate. Die aktuellen, spezifischen Preise finden Sie auf der Modellseite für Kimi K2.6 bei Atlas Cloud.
Anleitungen, Tutorials und Produkt-Updates, mit denen Sie das Beste aus Atlas Cloud herausholen.
Join the Discord community for the latest model updates, prompts, and support.