
Atlas Cloud ospita l'intera gamma Kimi tramite la MoonshotAI API, da K2-Thinking per il ragionamento profondo a K2.6 per la programmazione tramite agenti. Tutto a consumo, con 262K di contesto.
Alimenta chat, ragionamento e agenti su larga scala con i migliori modelli linguistici di grandi dimensioni, erogati in modo rapido ed economico su Atlas Cloud.
Compare standard vs. our pricing across every Moonshot AI model.
| Model | Standard Price (USD) | Our Price (USD) | Discount | |
|---|---|---|---|---|
| Kimi K2.5 | $0.6/$3per 1M tokens262.1K context | $0.49/$2.5M in/outper 1M tokens262.1K context | — | View |
| Kimi-K2-Thinking | $0.6/$2.5per 1M tokens262.1K context | $0.6/$2.5M in/outper 1M tokens262.1K context | — | View |
| Kimi-K2-Instruct-0905 | $0.6/$2.5per 1M tokens262.1K context | $0.6/$2.5M in/outper 1M tokens262.1K context | — | View |
| Kimi-K2-Instruct | $0.6/$2.5per 1M tokens131.1K context | $0.7/$2.5M in/outper 1M tokens131.1K context | — | View |
Instantly explore and experiment with 300+ production-ready models in the Atlas Playground. Start customizing with one click.
Lo sciame di agenti e le capacità di esecuzione a lungo termine di Kimi consentono ai team di eseguire compiti che richiederebbero giorni di lavoro umano in una singola sessione automatizzata. I team utilizzano la serie M insieme a K2-Thinking per coprire tutto, dalle modifiche autonome del codice alla ricerca su più documenti su larga scala.
I team di ingegneria utilizzano Kimi K2.6 per eseguire agenti di codifica a lungo termine che revisionano autonomamente le basi di codice di produzione durante sessioni prolungate di diverse ore. In un esempio documentato, K2.6 ha riscritto un motore di abbinamento finanziario di 8 anni in 13 ore e ha fornito un miglioramento del throughput del 185% senza intervento umano tra i commit. I prezzi a consumo di Atlas Cloud rendono pratico l'utilizzo di queste sessioni estese degli agenti senza impegni di capacità.
I team operativi utilizzano lo sciame di 300 agenti di Kimi K2.6 per elaborare grandi lotti di documenti in parallelo. Una singola esecuzione di orchestrazione ha abbinato un CV a 100 ruoli lavorativi e ha prodotto 100 curriculum completamente personalizzati come output. Lo stesso modello si applica alla revisione dei contratti, ai controlli di conformità e a qualsiasi flusso di lavoro in cui un input fisso deve essere valutato rispetto a un insieme di obiettivi ampio e variabile.
I team di ricerca e legali utilizzano Kimi K2-Thinking per problemi di analisi in più fasi che richiedono un ragionamento interno prolungato. Il modello supporta fino a 200-300 chiamate di strumenti sequenziali per sessione, eseguendo cicli di ragionamento-chiamata-ragionamento senza suggerimenti umani tra una fase e l'altra. Su Atlas Cloud ha un prezzo di 0,6 $ per milione di token di input e condivide la finestra di contesto di 262K con il resto della gamma Kimi.
I team accademici e di contenuti utilizzano Kimi K2.6 per trasformare i documenti di origine in risultati di ricerca completi. In un'esecuzione dimostrativa, K2.6 ha convertito un articolo di astrofisica in un documento di ricerca di 40 pagine, un set di dati strutturato con oltre 20.000 voci e 14 grafici di livello astronomico in una singola sessione. Ciò riduce i tempi di consegna dei flussi di lavoro dalla letteratura ai risultati da settimane a ore.
I team di crescita e vendite utilizzano gli sciami di Kimi K2.6 per identificare potenziali clienti e generare risorse di sensibilizzazione in parallelo. Un'esecuzione di esempio ha individuato 30 negozi al dettaglio in una città target senza siti web e ha generato una landing page per ciascuno. Lo stesso modello funziona per l'arricchimento dei lead, la mappatura del panorama competitivo e qualsiasi attività che combini la scoperta e la generazione di contenuti su scala di lista.
I team di prodotto e di dati utilizzano le capacità di visione native di Kimi K2.5 e K2.6 per elaborare input di immagini e video insieme al testo nella stessa chiamata API. L'encoder MoonViT gestisce diagrammi, screenshot, mockup di UI e scansioni di documenti senza pre-elaborazione esterna. Questo è utile per le pipeline che convertono le specifiche visive direttamente in codice, o estraggono dati strutturati da documenti ricchi di immagini.
Kimi K2.6 is MoonshotAI's latest open-source multimodal LLM, released in April 2026 under a Modified MIT license. It runs a Mixture-of-Experts architecture with 1 trillion total parameters and 32 billion active during inference. It is designed for agentic coding, long-horizon task execution, and multi-agent swarm orchestration.
Kimi K2.6 scala fino a 300 sub-agenti che eseguono fino a 4.000 passaggi coordinati in una singola esecuzione. Kimi K2.5 su Atlas Cloud supporta l'esecuzione a sciame con un massimo di 100 sub-agenti. I compiti vengono scomposti dinamicamente in sottocompiti paralleli e specializzati per dominio, per un output completamente autonomo.
Kimi K2-Thinking utilizza un profondo ragionamento a catena di pensieri (chain-of-thought) con un massimo di 200-300 chiamate sequenziali di strumenti per sessione. Il modello ragiona, chiama uno strumento, interpreta il risultato, chiama un altro strumento e continua questo ciclo senza input umano. È adatto per inferenze logiche in più fasi, matematica complessa e problemi in cui il ragionamento interno esteso migliora l'accuratezza.
Sì. Kimi K2.5 e K2.6 includono MoonViT, un codificatore visivo da 400 milioni di parametri che elabora immagini e video in modo nativo. È possibile passare input di immagini o video direttamente nella chiamata API insieme al testo senza pre-elaborazione esterna. Questo supporta i flussi di lavoro di analisi visiva, comprensione dei documenti e generazione da immagine a codice.
Sì. Kimi K2.6 è rilasciato sotto una licenza MIT modificata, che ne consente l'uso commerciale. I pesi aperti sono disponibili su HuggingFace per distribuzioni self-hosted. Atlas Cloud fornisce inoltre K2.6 tramite API per i team che preferiscono un accesso gestito senza costi generali di infrastruttura.
Kimi K2.6 ottiene un punteggio dell'80,2% su SWE-Bench Verified e del 54,0% su Humanity's Last Exam con strumenti, superando GPT-5.5 in entrambi i benchmark. È inoltre in testa su BrowseComp con l'83,2%, superando GPT-5.4. Questi risultati vengono raggiunti a un costo per milione di token inferiore di circa l'80% rispetto a GPT-5.5.
Kimi K2.5 ha un prezzo di 0,49 $ per milione di token di input e di 2,5 $ per milione di token di output su Atlas Cloud. Kimi K2-Thinking e K2-Instruct-0905 funzionano a 0,6 $ per milione di token di input con la stessa tariffa di output. Consulta la pagina del modello Kimi K2.6 su Atlas Cloud per i prezzi specifici attuali.
Guide, tutorial e novità di prodotto per sfruttare al meglio Atlas Cloud.
Join the Discord community for the latest model updates, prompts, and support.