Moonshot AI Models on AtlasCloud | Kimi

Atlas Cloud hostet das gesamte Kimi-Lineup über die MoonshotAI API, von K2-Thinking für tiefgreifendes Schlussfolgern bis hin zu K2.6 für agentenbasiertes Programmieren. Alles nutzungsbasiert (Pay-as-you-go), mit 262K Kontext.

Large Language Models by Moonshot AI

Treiben Sie Chat, Reasoning und Agenten im großen Maßstab mit führenden großen Sprachmodellen an – schnell und kostengünstig bereitgestellt auf Atlas Cloud.

Alle Modelle ansehen

LLM

Kimi

Die Kimi API ist die Open-Weight-K2-Reihe von Moonshot AI – vom nativ multimodalen K2.5 bis zum auf Coding spezialisierten K2.7 Code. Da Vision direkt in das Modell integriert ist, können Sie Screenshots, UI-Mockups und kurze Videos in funktionsfähigen Frontend-Code umwandeln, bis zu 100 parallele Sub-Agents koordinieren und über einen Kontext von 256K Tokens hinweg schlussfolgern. Atlas Cloud stellt die gesamte Familie über einen einheitlichen Endpoint mit transparenter Pay-as-you-go-Preisgestaltung bereit. Beginnen Sie noch heute mit der Entwicklung.

4 ModelleErkunden Sie Kimi

Moonshot AI Models API Pricing Details

Compare standard vs. our pricing across every Moonshot AI model.

Model	Standard Price (USD)	Our Price (USD)	Discount
Kimi K3	$3/$15per 1M tokens1048.6K context	$3/$15M in/outper 1M tokens1048.6K context	—	View
Kimi K2.7 Code	$0.95/$4per 1M tokens262.1K context	$0.95/$4M in/outper 1M tokens262.1K context	—	View
Kimi K2.6	$0.95/$4per 1M tokens262.1K context	$0.95/$4M in/outper 1M tokens262.1K context	—	View
Kimi K2.5	$0.6/$3per 1M tokens262.1K context	$0.49/$2.5M in/outper 1M tokens262.1K context	—	View

Explore models from other providers

Instantly explore and experiment with 400+ production-ready models in the Atlas Playground. Start customizing with one click.

xAI

Moonshot AI API-Anwendungsfälle, die Sie auf der Atlas Cloud entwickeln können

Die Agenten-Schwarm- und Langzeitausführungsfunktionen von Kimi ermöglichen es Teams, Aufgaben, die Tage menschlicher Arbeit in Anspruch nehmen würden, in einer einzigen automatisierten Sitzung auszuführen. Teams nutzen die M-series zusammen mit K2-Thinking, um alles von autonomen Codeänderungen bis hin zu umfassender Multi-Dokumenten-Recherche im großen Maßstab abzudecken.

Modernisierung der Legacy-Codebasis

Engineering-Teams nutzen Kimi K2.6, um langlaufende Coding-Agenten auszuführen, die Produktions-Codebasen in mehrstündigen Sitzungen autonom überarbeiten. In einem dokumentierten Beispiel hat K2.6 eine 8 Jahre alte Finanz-Matching-Engine über 13 Stunden hinweg neu geschrieben und eine Durchsatzsteigerung von 185 % ohne menschliches Eingreifen zwischen den Commits geliefert. Die Pay-as-you-go-Preisgestaltung von Atlas Cloud macht es praktisch möglich, diese ausgedehnten agentischen Sitzungen ohne Kapazitätsverpflichtungen durchzuführen.

Parallele Dokumenten-Stapelverarbeitung

Betriebsteams nutzen den 300-Agenten-Schwarm von Kimi K2.6, um große Dokumentenstapel parallel zu verarbeiten. Ein einzelner Orchestrierungslauf glich einen Lebenslauf mit 100 Stellenprofilen ab und lieferte als Ergebnis 100 vollständig angepasste Lebensläufe. Dasselbe Muster gilt für Vertragsprüfungen, Compliance-Prüfungen und jeden Workflow, bei dem eine feste Eingabe gegen eine große, variable Menge von Zielen evaluiert werden muss.

Tiefes Schließen für komplexe Analysen

Forschungs- und Rechtsteams nutzen Kimi K2-Thinking für mehrstufige Analyseprobleme, die ein erweitertes internes Schlussfolgern erfordern. Das Modell unterstützt bis zu 200 bis 300 sequentielle Werkzeugaufrufe pro Sitzung und durchläuft dabei Zyklen von Schlussfolgern-Aufrufen-Schlussfolgern (reason-call-reason) ohne menschliche Eingaben zwischen den Schritten. Auf Atlas Cloud kostet es 0,6 $ pro Million Input-Token und teilt sich das 262K-Kontextfenster mit der restlichen Kimi-Produktlinie.

Automatisierte Erstellung von Forschungsarbeiten

Wissenschafts- und Content-Teams nutzen Kimi K2.6, um Quelldokumente in vollständige Forschungsergebnisse umzuwandeln. In einem Demonstrationslauf wandelte K2.6 in einer einzigen Sitzung ein Astrophysik-Papier in eine 40-seitige Forschungsarbeit, einen strukturierten Datensatz mit über 20.000 Einträgen und 14 astronomietaugliche Diagramme um. Dies reduziert die Durchlaufzeit von Literatur-zu-Ergebnis-Workflows von Wochen auf Stunden.

Geschäftsprospektion in großem Maßstab

Wachstums- und Vertriebsteams nutzen Kimi K2.6 Schwärme, um parallel potenzielle Kunden zu identifizieren und Outreach-Ressourcen zu generieren. Ein Beispiellauf identifizierte in einer Zielstadt 30 Einzelhandelsgeschäfte ohne Websites und erstellte für jedes eine Landingpage. Das gleiche Muster funktioniert für die Anreicherung von Leads, die Kartierung der Wettbewerbslandschaft und jede Aufgabe, die Entdeckung und Content-Generierung auf Listenebene kombiniert.

Visuelle Dokumenten- und Codeanalyse

Produkt- und Datenteams nutzen die nativen Vision-Funktionen von Kimi K2.5 und K2.6, um Bild- und Videoeingaben zusammen mit Text im selben API-Aufruf zu verarbeiten. Der MoonViT-Encoder verarbeitet Diagramme, Screenshots, UI-Mockups und Dokumentenscans ohne externe Vorverarbeitung. Dies ist nützlich für Pipelines, die visuelle Spezifikationen direkt in Code umwandeln oder strukturierte Daten aus bildlastigen Dokumenten extrahieren.

Verwandeln Sie Ihre Unternehmensvision mit Atlas Cloud AI in Realität.

Vertrieb kontaktieren

Häufig gestellte Fragen zu den Moonshot AI-Modellen

Kimi K2.6 is MoonshotAI's latest open-source multimodal LLM, released in April 2026 under a Modified MIT license. It runs a Mixture-of-Experts architecture with 1 trillion total parameters and 32 billion active during inference. It is designed for agentic coding, long-horizon task execution, and multi-agent swarm orchestration.

Kimi K2.6 skaliert auf 300 Sub-Agenten, die in einem einzigen Durchlauf bis zu 4.000 koordinierte Schritte ausführen. Kimi K2.5 auf der Atlas Cloud unterstützt die Schwarm-Ausführung mit bis zu 100 Sub-Agenten. Aufgaben werden dynamisch in parallele, domänenspezifische Teilaufgaben zerlegt, um eine vollautonome Ausgabe zu erzielen.

Kimi K2-Thinking nutzt tiefgehendes Chain-of-Thought-Reasoning mit bis zu 200 bis 300 aufeinanderfolgenden Werkzeugaufrufen pro Sitzung. Das Modell schlussfolgert, ruft ein Werkzeug auf, interpretiert das Ergebnis, ruft ein weiteres Werkzeug auf und setzt diese Schleife ohne menschliches Eingreifen fort. Es eignet sich für mehrstufige logische Inferenz, komplexe Mathematik und Probleme, bei denen ein erweitertes internes Reasoning die Genauigkeit verbessert.

Ja. Kimi K2.5 und K2.6 beinhalten MoonViT, einen Vision-Encoder mit 400 Millionen Parametern, der Bilder und Videos nativ verarbeitet. Sie können Bild- oder Videoeingaben ohne externe Vorverarbeitung direkt im API-Aufruf zusammen mit Text übergeben. Dies unterstützt Workflows für visuelle Analysen, Dokumentenverständnis und Bild-zu-Code-Generierung.

Ja. Kimi K2.6 wird unter einer modifizierten MIT-Lizenz veröffentlicht, die eine kommerzielle Nutzung erlaubt. Offene Gewichtungen sind auf HuggingFace für selbst gehostete Deployments verfügbar. Atlas Cloud bietet K2.6 auch über eine API für Teams an, die einen verwalteten Zugriff ohne Infrastruktur-Overhead bevorzugen.

Kimi K2.6 erreicht 80,2 % bei SWE-Bench Verified und 54,0 % bei Humanity's Last Exam mit Tools und übertrifft damit GPT-5.5 in beiden Benchmarks. Es führt auch bei BrowseComp mit 83,2 % vor GPT-5.4. Diese Ergebnisse werden bei etwa 80 % geringeren Kosten pro Million Tokens im Vergleich zu GPT-5.5 erzielt.

Kimi K2.5 kostet auf Atlas Cloud 0,49 $ pro Million Input-Tokens und 2,5 $ pro Million Output-Tokens. Kimi K2-Thinking und K2-Instruct-0905 laufen für 0,6 $ pro Million Input-Tokens bei gleicher Output-Rate. Die aktuellen, spezifischen Preise finden Sie auf der Modellseite für Kimi K2.6 bei Atlas Cloud.

Weitere Familien Erkunden

Seedance 2.0

Die Seedance 2.0 API bietet Ihnen Produktionszugriff auf das multimodale Videomodell von ByteDance – quadmodale Eingaben (Text, Bild, Video, Audio) und ein branchenführendes „Universal Reference“-System, das Bildkomposition, Kamerabewegungen und Charakteraktionen über verschiedene Einstellungen hinweg fixiert. Integrieren Sie Kontrolle auf Regisseur-Niveau mit nur einem API-Aufruf, einem Pauschalpreis von 0,09 $/s, sofortigem Key und ohne Warteliste – unterstützt durch branchenübliche Verfügbarkeit und Compliance für Unternehmen. Seedance 2.0 Native 4K ist ab sofort live!

Familie Anzeigen

Grok Imagine

Die Grok Imagine API bietet Entwicklern die Bild-, Video- und Audiogenerierung von xAI in einer einzigen Suite. Sie erzeugt Bilder mit bis zu 2K Auflösung und mehrsprachigem Text-Rendering sowie bis zu 15 Sekunden lange Videos mit nativem, synchronisiertem Audio und referenzbasierter Bearbeitung. Auf Atlas Cloud führt ein einziger Schlüssel jeden Grok Imagine-Modus aus, sodass Sie ohne separate Einrichtung zwischen Bild, Video und Audio wechseln können, ab 0,02 $ pro Bild und 0,05 $ pro Sekunde.

Familie Anzeigen

Gemini Omni Flash

Die Gemini Omni API bringt das multimodale Videogenerierungs- und Bearbeitungsmodell von Google DeepMind, vorgestellt auf der Google I/O 2026, in Ihren Stack. Gemini Omni verbindet die Reasoning-Engine von Gemini mit generativen Medien und akzeptiert beliebige Kombinationen aus Text, Bildern, Video und Audio, um konsistente, wissensbasierte Ergebnisse zu erzeugen. Verfeinern Sie die Resultate im natürlichen Dialog – tauschen Sie Objekte aus, schreiben Sie Szenen um und wechseln Sie den Stil, während Physik, Figuren und Kontinuität erhalten bleiben. Atlas Cloud stellt das komplette Gemini-Omni-Flash-Lineup bereit – Text-to-Video, Image-to-Video mit bis zu 7 Referenzbildern und Reference-to-Video – über eine einheitliche API mit transparenter sekundengenauer Abrechnung ab $0.112 und ohne Abo. Legen Sie noch heute los.

Familie Anzeigen

GPT Image 2

Die GPT Image 2 API bietet Entwicklern Zugang zum neuesten Bildmodell von OpenAI, dem Nachfolger von GPT Image 1.5. Es generiert und bearbeitet Bilder mit präziser Textdarstellung über lateinische und CJK-Schriften hinweg sowie mit starker Komposition für Poster, Mockups und Infografiken. Auf Atlas Cloud erreichen Sie es über eine einzige vereinheitlichte API zusammen mit über 300 Modellen, mit kostenlosen Credits, 99,99 % Verfügbarkeit und ohne erforderliche OpenAI-Organisationsverifizierung.

Familie Anzeigen

Google

Die leistungsstärksten kreativen Modelle von Google sind alle auf Atlas Cloud verfügbar. Veo 3.1 liefert kinoreife Videogenerierung, Nano Banana 2 ermöglicht die Erstellung von High-Fidelity-Bildern und Gemini bringt multimodale Intelligenz in jeden Workflow. Greifen Sie über einen einzigen API key mit Day-0-Verfügbarkeit und Pay-as-you-go-Preisen auf die vollständige Google-Modellsuite zu.

Familie Anzeigen

Seedance 2.0 Mini

Seedance 2.0 Mini bringt die multimodale Videogenerierung von ByteDance in Workflows, bei denen Geschwindigkeit und Kosten am wichtigsten sind. Es bietet die Kernfunktionen von Seedance 2.0 bei geringerem Ressourcenverbrauch – schnellere Generierung, niedrigere Kosten pro Video und dieselbe API-Integration, die Sie bereits nutzen. Für Teams, die hochvolumige Pipelines betreiben oder Prototyping in großem Maßstab durchführen, ist Mini der praktische Standard.

Familie Anzeigen

ByteDance

Von der Generierung kinoreifer Videos bis zur Erstellung von High-Fidelity-Bildern sind die leistungsstärksten Modelle von ByteDance jetzt auf der Atlas Cloud verfügbar. Führen Sie Seedance und Seedream in großem Maßstab zu den niedrigsten Inferenzpreisen und ohne Infrastruktur-Overhead aus.

Familie Anzeigen

Alibaba

Atlas Cloud vereint das gesamte Modell-Lineup von Alibaba unter einer einzigen API: Qwen für Sprach- und Bildaufgaben sowie Wan für die Videogenerierung mit bis zu 1080p. Greifen Sie auf jedes Modell im Pay-as-you-go-Verfahren ohne Abonnements zu. Die Alibaba API ist über eine einzige Base-URL mit Ihrem bestehenden OpenAI-kompatiblen Client verfügbar.

Familie Anzeigen

OpenAI

Atlas Cloud bietet Ihnen Zugriff auf das gesamte Lineup der OpenAI API, von GPT Image 2 für die Bildgenerierung bis hin zu Sora 2 für Videos. Jedes Modell ist als Pay-as-you-go-Service ohne monatliche Verpflichtung verfügbar. Die Integration erfolgt durch den einfachen Austausch einer einzigen Basis-URL über die OpenAI-kompatible API.

Familie Anzeigen

xAI

Erstellen Sie vollständige Bild- und Videopipelines unter Verwendung der xAI API auf Atlas Cloud. Generieren Sie in 2K, bearbeiten Sie mit Referenzbildern und animieren Sie Bilder zu audiosynchronen Clips.

Familie Anzeigen

Kwaivgi

Die Kwaivgi API 15 % unter dem Standardpreis. Atlas Cloud bietet Day-0-Zugriff auf neue Kling-Releases mit nutzungsbasierter Preisgestaltung (Pay-as-you-go) und ohne Platzbeschränkungen. Ein Konto, ein Schlüssel, jedes Kling-Modell von der Standard- bis zur Master-Stufe.

Familie Anzeigen

Seedream 5.0 Pro

Die Seedream 5.0 Pro API bietet Entwicklern das steuerbare Bildbearbeitungsmodell von ByteDance auf Atlas Cloud. Sie platziert Bearbeitungen präzise mit Ankern und Koordinaten, trennt Bilder in bearbeitbare Ebenen, verschmilzt mehrere Referenzen und passt exakte Farben und Materialien an, mit mehrsprachigem Text in 2K und 3K. Auf Atlas Cloud erreichen Sie es über einen einzigen Schlüssel!

Familie Anzeigen