Moonshot AI Models on AtlasCloud | Kimi

Atlas Cloud aloja la línea completa de Kimi a través de la MoonshotAI API, desde K2-Thinking para el razonamiento profundo hasta K2.6 para la programación de agentes. Todo de pago por uso, con 262K de contexto.

Large Language Models by Moonshot AI

Impulsa chat, razonamiento y agentes a gran escala con los principales grandes modelos de lenguaje, servidos de forma rápida y asequible en Atlas Cloud.

Ver todos los modelos

Moonshot AI Models API Pricing Details

Compare standard vs. our pricing across every Moonshot AI model.

ModelStandard Price (USD)Our Price (USD)Discount
Kimi K2.5
$0.6/$3per 1M tokens262.1K context
$0.49/$2.5M in/outper 1M tokens262.1K context
View
Kimi-K2-Thinking
$0.6/$2.5per 1M tokens262.1K context
$0.6/$2.5M in/outper 1M tokens262.1K context
View
Kimi-K2-Instruct-0905
$0.6/$2.5per 1M tokens262.1K context
$0.6/$2.5M in/outper 1M tokens262.1K context
View
Kimi-K2-Instruct
$0.6/$2.5per 1M tokens131.1K context
$0.7/$2.5M in/outper 1M tokens131.1K context
View

Explore models from other providers

Instantly explore and experiment with 300+ production-ready models in the Atlas Playground. Start customizing with one click.

Casos de uso de la API de Moonshot AI que puede desarrollar en Atlas Cloud

El enjambre de agentes y las capacidades de ejecución a largo plazo de Kimi permiten a los equipos ejecutar tareas que requerirían días de esfuerzo humano en una sola sesión automatizada. Los equipos utilizan la serie M junto con K2-Thinking para abarcar todo, desde cambios de código autónomos hasta investigaciones de múltiples documentos a gran escala.

Modernización de la Base de Código Heredado

Los equipos de ingeniería utilizan Kimi K2.6 para ejecutar agentes de programación a largo plazo que revisan y modifican de forma autónoma bases de código de producción durante sesiones extendidas de varias horas. En un ejemplo documentado, K2.6 reescribió un motor de emparejamiento financiero de 8 años de antigüedad a lo largo de 13 horas y logró una mejora del rendimiento del 185 % sin intervención humana entre confirmaciones (commits). El modelo de precios de pago por uso de Atlas Cloud hace que sea práctico ejecutar estas sesiones extendidas de agentes sin compromisos de capacidad.

Procesamiento paralelo de documentos por lotes

Los equipos de operaciones utilizan el enjambre de 300 agentes de Kimi K2.6 para procesar grandes lotes de documentos en paralelo. Una sola ejecución de orquestación emparejó un currículum con 100 roles de trabajo y produjo 100 currículums completamente personalizados como resultado. El mismo patrón se aplica a la revisión de contratos, comprobaciones de cumplimiento y cualquier flujo de trabajo donde una entrada fija deba ser evaluada frente a un conjunto grande y variable de objetivos.

Razonamiento Profundo para Análisis Complejos

Los equipos legales y de investigación utilizan Kimi K2-Thinking para problemas de análisis de múltiples pasos que requieren un razonamiento interno prolongado. El modelo admite hasta 200 a 300 llamadas de herramientas secuenciales por sesión, iterando a través de ciclos de razonamiento-llamada-razonamiento sin indicaciones humanas entre pasos. En Atlas Cloud tiene un precio de $0.6 por millón de tokens de entrada y comparte la ventana de contexto de 262K con el resto de la línea Kimi.

Producción automatizada de artículos de investigación

Los equipos académicos y de contenido utilizan Kimi K2.6 para convertir documentos de origen en resultados de investigación completos. En una ejecución de demostración, K2.6 convirtió un artículo de astrofísica en un artículo de investigación de 40 páginas, un conjunto de datos estructurado con más de 20.000 entradas y 14 gráficos de nivel astronómico en una sola sesión. Esto reduce el tiempo de respuesta de los flujos de trabajo de literatura a resultados de semanas a horas.

Prospección Comercial a Gran Escala

Los equipos de crecimiento y ventas utilizan los enjambres de Kimi K2.6 para identificar clientes potenciales y generar activos de alcance en paralelo. Una ejecución de ejemplo identificó 30 tiendas minoristas en una ciudad objetivo sin sitios web y generó una página de aterrizaje para cada una. El mismo patrón funciona para el enriquecimiento de prospectos, el mapeo del panorama competitivo y cualquier tarea que combine el descubrimiento y la generación de contenido a escala de lista.

Análisis Visual de Documentos y Código

Los equipos de productos y datos utilizan las capacidades de visión nativas de Kimi K2.5 y K2.6 para procesar entradas de imagen y video junto con texto en la misma llamada de API. El codificador MoonViT maneja diagramas, capturas de pantalla, maquetas de UI y escaneos de documentos sin preprocesamiento externo. Esto es útil para los pipelines que convierten especificaciones visuales directamente en código, o extraen datos estructurados de documentos con gran cantidad de imágenes.

Haz realidad la visión de tu empresa con Atlas Cloud AI.

Contactar con ventas

Preguntas frecuentes sobre los modelos de Moonshot AI

Kimi K2.6 is MoonshotAI's latest open-source multimodal LLM, released in April 2026 under a Modified MIT license. It runs a Mixture-of-Experts architecture with 1 trillion total parameters and 32 billion active during inference. It is designed for agentic coding, long-horizon task execution, and multi-agent swarm orchestration.

Kimi K2.6 escala a 300 subagentes que ejecutan hasta 4.000 pasos coordinados en una sola ejecución. Kimi K2.5 en Atlas Cloud admite la ejecución en enjambre con hasta 100 subagentes. Las tareas se descomponen dinámicamente en subtareas paralelas y especializadas en el dominio para una salida totalmente autónoma.

Kimi K2-Thinking utiliza un razonamiento profundo de cadena de pensamiento con hasta 200 a 300 llamadas secuenciales a herramientas por sesión. El modelo razona, llama a una herramienta, interpreta el resultado, llama a otra herramienta y continúa este bucle sin intervención humana. Es adecuado para la inferencia lógica de múltiples pasos, matemáticas complejas y problemas en los que el razonamiento interno ampliado mejora la precisión.

Sí. Kimi K2.5 y K2.6 incluyen MoonViT, un codificador de visión de 400 millones de parámetros que procesa imágenes y vídeo de forma nativa. Puede pasar entradas de imagen o vídeo directamente en la llamada a la API junto con el texto sin preprocesamiento externo. Esto admite flujos de trabajo de análisis visual, comprensión de documentos y generación de imagen a código.

Sí. Kimi K2.6 se publica bajo una licencia MIT modificada, la cual permite su uso comercial. Los pesos abiertos están disponibles en HuggingFace para implementaciones autoalojadas. Atlas Cloud también ofrece K2.6 a través de API para los equipos que prefieren un acceso administrado sin gastos generales de infraestructura.

Kimi K2.6 obtiene una puntuación del 80,2 % en SWE-Bench Verified y del 54,0 % en Humanity's Last Exam con herramientas, superando a GPT-5.5 en ambos benchmarks. También lidera en BrowseComp con un 83,2 %, por encima de GPT-5.4. Estos resultados se logran con un coste por millón de tokens aproximadamente un 80 % menor que el de GPT-5.5.

Kimi K2.5 tiene un precio de 0,49 $ por millón de tokens de entrada y 2,5 $ por millón de tokens de salida en Atlas Cloud. Kimi K2-Thinking y K2-Instruct-0905 funcionan a 0,6 $ por millón de tokens de entrada con la misma tarifa de salida. Consulte la página del modelo Kimi K2.6 de Atlas Cloud para conocer sus precios específicos actuales.

Explorar Más Series

Seedance 2.0 Models

Seedance 2.0(by Bytedance) is a multimodal video generation model that redefines "controllable creation," moving beyond the limitations of text or start/end frames. It supports quad-modal inputs—text, image, video, and audio—and introduces an industry-leading "Universal Reference" system. By precisely replicating the composition, camera movement, and character actions from reference assets, Seedance 2.0 solves critical issues with character consistency and physical coherence, empowering creators to act as true "directors" with deep control over their output.

Ver Serie

Grok-Imagine Models

Grok Imagine Image Quality is xAI's latest AI image generation model, delivering studio-grade visuals with up to 2K resolution and razor-sharp detail. It offers best-in-class text rendering across multiple languages, photorealistic outputs with natural lighting, rich textures, and believable physics, plus tighter prompt following and image editing with reference inputs for precise creative control. Ideal for hero images, ad creatives, product renders, and brand-grade visuals.

Ver Serie

Gemini Omni

Gemini Omni (by Google DeepMind) is a video generation and editing model launched on May 20, 2026 at Google I/O that redefines the standard for "reasoning-driven creation," built specifically to solve the core challenge of AI video: making output that actually understands what you mean, not just what you type. It fuses Gemini's reasoning engine with generative capability, accepting any mix of images, text, video, and audio to produce consistent, knowledge-grounded output. Unlike models that start from scratch each time, Omni lets you edit through natural conversation — swapping objects, rewriting scenes, shifting styles — while keeping physics, characters, and continuity intact across every turn.

Ver Serie

GPT Image 2 Models

GPT Image 2 is a state-of-the-art multimodal foundation model engineered for exceptional text-to-image generation with unprecedented photorealism and creative versatility. Developed by OpenAI as the evolution of the DALL-E lineage, it transforms detailed natural language descriptions into hyper-realistic imagery at up to 4K resolution. With proprietary "Neural Rendering Engine" technology for precise visual control, GPT Image 2 delivers studio-quality results with accurate anatomy, lighting, and composition—making it the premier AI tool for professional creators, enterprises, and developers demanding production-ready visual assets.

Ver Serie

Google Models on Atlas Cloud | Gemini, Nano Bananas & Veo

Los modelos creativos más potentes de Google están todos disponibles en Atlas Cloud. Veo 3.1 ofrece generación de video cinematográfico, Nano Banana 2 impulsa la creación de imágenes de alta fidelidad y Gemini aporta inteligencia multimodal a cada flujo de trabajo. Acceda a la suite completa de modelos de Google a través de una sola API key con disponibilidad Day-0 y precios de pago por uso (pay-as-you-go).

Ver Serie

ByteDance Models on Atlas Cloud | Seedance & Seedream

Desde la generación de video cinematográfico hasta la creación de imágenes de alta fidelidad, los modelos más potentes de ByteDance están disponibles en Atlas Cloud. Ejecute Seedance y Seedream a gran escala con los precios de inferencia más bajos y cero gastos generales de infraestructura.

Ver Serie

Alibaba Models on Atlas Cloud | Wan & Qwen

Atlas Cloud reúne toda la línea de modelos de Alibaba bajo una sola API: Qwen para tareas de lenguaje e imagen, y Wan para la generación de video hasta 1080p. Acceda a cada modelo con pago por uso sin suscripciones. La API de Alibaba está disponible a través de una única URL base utilizando su cliente compatible con OpenAI existente.

Ver Serie

MAI Image 2.5 Models

MAI-Image-2.5 es la última familia de modelos de generación y edición de imágenes fotorrealistas de Microsoft, creada para el diseño comercial, la fotografía de productos y la creación de contenido listo para marcas. Disponible en variantes estándar y Flash tanto para la conversión de texto a imagen como para la edición de imágenes, ofrece las mejores puntuaciones Arena ELO de su clase a precios competitivos, a partir de 0,03 $ por imagen. Con una representación de texto precisa, una capacidad de edición quirúrgica y una generación natural de retratos, MAI-Image-2.5 está diseñado para equipos que necesitan recursos visuales con calidad de producción sin gastos generales de procesamiento posterior.

Ver Serie

Wan2.7 Models

Launching this March, Wan2.7 is the latest powerhouse in the Qwen ecosystem, delivering a massive upgrade in visual fidelity, audio synchronization, and motion consistency over version 2.6. This all-in-one AI video generator supports advanced features like first-and-last frame control, 3x3 grid synthesis, and instruction-based video editing. Outperforming competitors like Jimeng, Wan2.7 offers superior flexibility with support for real-person image inputs, up to five video references, and 1080P high-definition outputs spanning 2 to 15 seconds, making it the premier choice for professional digital storytelling and high-end content marketing.

Ver Serie

Nano Banana2 Models

Nano Banana 2 (by Google), is a generative image model that perfectly balances lightning-fast rendering with exceptional visual quality. With an improved price-performance ratio, it achieves breakthrough micro-detail depiction, accurate native text rendering, and complex physical structure reconstruction. It serves as a highly efficient, commercial-grade visual production tool for developers, marketing teams, and content creators.

Ver Serie

Midjourney Models

Midjourney is a proprietary AI image and video generation platform developed by Midjourney, Inc. (San Francisco). Founded in 2021 by David Holz, it has become the aesthetic gold standard in generative AI — transforming text prompts into cinematic, painterly visuals at native 2K resolution. The latest V8.1 architecture, rebuilt from scratch on GPU-native PyTorch, delivers 4–5× faster generation, true 2048×2048 output without upscaling artifacts, and a signature visual style that remains unmatched by competitors. With the addition of Video V1, Midjourney extends its aesthetic into motion — animating still images into atmospheric 5-second cinematic clips. From brand campaigns to film pre-visualization to game concept art, Midjourney is the premier AI creative tool for professionals who demand both speed and artistry.

Ver Serie

PixVerse Models

PixVerse, developed by AISphere, is a video generation model series built around one idea: giving creators director-level control over every frame. V6 is the flagship generation model, covering text-to-video, image-to-video, reference-to-video, start-and-end frame control, and video extension in a single cohesive pipeline. C1 takes a different approach — it is a storyboard-native model designed for multi-shot narrative production, where scene continuity and visual consistency across clips matter as much as individual frame quality. Both series are available on Atlas Cloud, starting from $0.025 per second, with no infrastructure setup required.

Ver Serie

Artículos recomendados

Guías, tutoriales y novedades de producto para aprovechar al máximo Atlas Cloud.

Join our Discord community

Join the Discord community for the latest model updates, prompts, and support.