Moonshot AI Models on AtlasCloud | Kimi

Atlas Cloud aloja la línea completa de Kimi a través de la MoonshotAI API, desde K2-Thinking para el razonamiento profundo hasta K2.6 para la programación de agentes. Todo de pago por uso, con 262K de contexto.

Large Language Models by Moonshot AI

Impulsa chat, razonamiento y agentes a gran escala con los principales grandes modelos de lenguaje, servidos de forma rápida y asequible en Atlas Cloud.

Ver todos los modelos

LLM

Kimi

Kimi API es la línea K2 de pesos abiertos de Moonshot AI, desde el K2.5 multimodal nativo hasta el K2.7 Code especializado en programación. Como la visión está integrada en el modelo, puedes convertir capturas de pantalla, maquetas de interfaz de usuario y videos cortos en código frontend funcional, coordinar hasta 100 subagentes en paralelo y razonar en un contexto de 256K tokens. Atlas Cloud ofrece toda la familia a través de un único endpoint unificado con precios transparentes de pago por uso. Empieza a crear hoy mismo.

4 modelosExplorar Kimi

Moonshot AI Models API Pricing Details

Compare standard vs. our pricing across every Moonshot AI model.

Model	Standard Price (USD)	Our Price (USD)	Discount
Kimi K3	$3/$15per 1M tokens1048.6K context	$3/$15M in/outper 1M tokens1048.6K context	—	View
Kimi K2.7 Code	$0.95/$4per 1M tokens262.1K context	$0.95/$4M in/outper 1M tokens262.1K context	—	View
Kimi K2.6	$0.95/$4per 1M tokens262.1K context	$0.95/$4M in/outper 1M tokens262.1K context	—	View
Kimi K2.5	$0.6/$3per 1M tokens262.1K context	$0.49/$2.5M in/outper 1M tokens262.1K context	—	View

Explore models from other providers

Instantly explore and experiment with 400+ production-ready models in the Atlas Playground. Start customizing with one click.

xAI

Casos de uso de la API de Moonshot AI que puede desarrollar en Atlas Cloud

El enjambre de agentes y las capacidades de ejecución a largo plazo de Kimi permiten a los equipos ejecutar tareas que requerirían días de esfuerzo humano en una sola sesión automatizada. Los equipos utilizan la serie M junto con K2-Thinking para abarcar todo, desde cambios de código autónomos hasta investigaciones de múltiples documentos a gran escala.

Modernización de la Base de Código Heredado

Los equipos de ingeniería utilizan Kimi K2.6 para ejecutar agentes de programación a largo plazo que revisan y modifican de forma autónoma bases de código de producción durante sesiones extendidas de varias horas. En un ejemplo documentado, K2.6 reescribió un motor de emparejamiento financiero de 8 años de antigüedad a lo largo de 13 horas y logró una mejora del rendimiento del 185 % sin intervención humana entre confirmaciones (commits). El modelo de precios de pago por uso de Atlas Cloud hace que sea práctico ejecutar estas sesiones extendidas de agentes sin compromisos de capacidad.

Procesamiento paralelo de documentos por lotes

Los equipos de operaciones utilizan el enjambre de 300 agentes de Kimi K2.6 para procesar grandes lotes de documentos en paralelo. Una sola ejecución de orquestación emparejó un currículum con 100 roles de trabajo y produjo 100 currículums completamente personalizados como resultado. El mismo patrón se aplica a la revisión de contratos, comprobaciones de cumplimiento y cualquier flujo de trabajo donde una entrada fija deba ser evaluada frente a un conjunto grande y variable de objetivos.

Razonamiento Profundo para Análisis Complejos

Los equipos legales y de investigación utilizan Kimi K2-Thinking para problemas de análisis de múltiples pasos que requieren un razonamiento interno prolongado. El modelo admite hasta 200 a 300 llamadas de herramientas secuenciales por sesión, iterando a través de ciclos de razonamiento-llamada-razonamiento sin indicaciones humanas entre pasos. En Atlas Cloud tiene un precio de $0.6 por millón de tokens de entrada y comparte la ventana de contexto de 262K con el resto de la línea Kimi.

Producción automatizada de artículos de investigación

Los equipos académicos y de contenido utilizan Kimi K2.6 para convertir documentos de origen en resultados de investigación completos. En una ejecución de demostración, K2.6 convirtió un artículo de astrofísica en un artículo de investigación de 40 páginas, un conjunto de datos estructurado con más de 20.000 entradas y 14 gráficos de nivel astronómico en una sola sesión. Esto reduce el tiempo de respuesta de los flujos de trabajo de literatura a resultados de semanas a horas.

Prospección Comercial a Gran Escala

Los equipos de crecimiento y ventas utilizan los enjambres de Kimi K2.6 para identificar clientes potenciales y generar activos de alcance en paralelo. Una ejecución de ejemplo identificó 30 tiendas minoristas en una ciudad objetivo sin sitios web y generó una página de aterrizaje para cada una. El mismo patrón funciona para el enriquecimiento de prospectos, el mapeo del panorama competitivo y cualquier tarea que combine el descubrimiento y la generación de contenido a escala de lista.

Análisis Visual de Documentos y Código

Los equipos de productos y datos utilizan las capacidades de visión nativas de Kimi K2.5 y K2.6 para procesar entradas de imagen y video junto con texto en la misma llamada de API. El codificador MoonViT maneja diagramas, capturas de pantalla, maquetas de UI y escaneos de documentos sin preprocesamiento externo. Esto es útil para los pipelines que convierten especificaciones visuales directamente en código, o extraen datos estructurados de documentos con gran cantidad de imágenes.

Haz realidad la visión de tu empresa con Atlas Cloud AI.

Contactar con ventas

Preguntas frecuentes sobre los modelos de Moonshot AI

Kimi K2.6 is MoonshotAI's latest open-source multimodal LLM, released in April 2026 under a Modified MIT license. It runs a Mixture-of-Experts architecture with 1 trillion total parameters and 32 billion active during inference. It is designed for agentic coding, long-horizon task execution, and multi-agent swarm orchestration.

Kimi K2.6 escala a 300 subagentes que ejecutan hasta 4.000 pasos coordinados en una sola ejecución. Kimi K2.5 en Atlas Cloud admite la ejecución en enjambre con hasta 100 subagentes. Las tareas se descomponen dinámicamente en subtareas paralelas y especializadas en el dominio para una salida totalmente autónoma.

Kimi K2-Thinking utiliza un razonamiento profundo de cadena de pensamiento con hasta 200 a 300 llamadas secuenciales a herramientas por sesión. El modelo razona, llama a una herramienta, interpreta el resultado, llama a otra herramienta y continúa este bucle sin intervención humana. Es adecuado para la inferencia lógica de múltiples pasos, matemáticas complejas y problemas en los que el razonamiento interno ampliado mejora la precisión.

Sí. Kimi K2.5 y K2.6 incluyen MoonViT, un codificador de visión de 400 millones de parámetros que procesa imágenes y vídeo de forma nativa. Puede pasar entradas de imagen o vídeo directamente en la llamada a la API junto con el texto sin preprocesamiento externo. Esto admite flujos de trabajo de análisis visual, comprensión de documentos y generación de imagen a código.

Sí. Kimi K2.6 se publica bajo una licencia MIT modificada, la cual permite su uso comercial. Los pesos abiertos están disponibles en HuggingFace para implementaciones autoalojadas. Atlas Cloud también ofrece K2.6 a través de API para los equipos que prefieren un acceso administrado sin gastos generales de infraestructura.

Kimi K2.6 obtiene una puntuación del 80,2 % en SWE-Bench Verified y del 54,0 % en Humanity's Last Exam con herramientas, superando a GPT-5.5 en ambos benchmarks. También lidera en BrowseComp con un 83,2 %, por encima de GPT-5.4. Estos resultados se logran con un coste por millón de tokens aproximadamente un 80 % menor que el de GPT-5.5.

Kimi K2.5 tiene un precio de 0,49 $ por millón de tokens de entrada y 2,5 $ por millón de tokens de salida en Atlas Cloud. Kimi K2-Thinking y K2-Instruct-0905 funcionan a 0,6 $ por millón de tokens de entrada con la misma tarifa de salida. Consulte la página del modelo Kimi K2.6 de Atlas Cloud para conocer sus precios específicos actuales.

Explorar Más Series

Seedance 2.0

La API de Seedance 2.0 le ofrece acceso de producción al modelo de video multimodal de ByteDance: entradas cuatrimodales (texto, imagen, video, audio) y un sistema "Universal Reference" líder en la industria que bloquea la composición, el movimiento de la cámara y las acciones de los personajes en diferentes tomas. Integre un control de nivel de director con una sola llamada a la API, una tarifa fija de $0.09/s, clave instantánea y sin lista de espera, todo respaldado por un tiempo de actividad y cumplimiento de nivel empresarial. ¡Seedance 2.0 Native 4K ya está disponible!

Ver Serie

Grok Imagine

La Grok Imagine API ofrece a los desarrolladores la generación de imágenes, video y audio de xAI en una sola suite. Produce imágenes de hasta 2K con renderizado de texto multilingüe, además de videos de hasta 15 segundos con audio nativo y sincronizado, y edición basada en referencias. En Atlas Cloud, una sola clave ejecuta cada modo de Grok Imagine, por lo que puede alternar entre imagen, video y audio sin configuraciones separadas, desde $0.02 por imagen y $0.05 por segundo.

Ver Serie

Gemini Omni Flash

La Gemini Omni API lleva a tu stack el modelo multimodal de generación y edición de vídeo de Google DeepMind, presentado en Google I/O 2026. Gemini Omni fusiona el motor de razonamiento de Gemini con los medios generativos y acepta cualquier combinación de texto, imágenes, vídeo y audio para producir resultados coherentes y fundamentados en conocimiento. Refina los resultados mediante conversación natural: sustituye objetos, reescribe escenas y cambia de estilo mientras la física, los personajes y la continuidad permanecen intactos. Atlas Cloud ofrece toda la gama Gemini Omni Flash —texto a vídeo, imagen a vídeo con hasta 7 imágenes de referencia y referencia a vídeo— a través de una única API unificada, con precios transparentes por segundo desde $0.112 y sin suscripción. Empieza a construir hoy mismo.

Ver Serie

GPT Image 2

La API de GPT Image 2 ofrece a los desarrolladores acceso al último modelo de imágenes de OpenAI, el sucesor de GPT Image 1.5. Genera y edita imágenes con una representación de texto precisa en caracteres latinos y CJK, además de una sólida composición para carteles, maquetas e infografías. En Atlas Cloud, puede acceder a ella a través de una API unificada junto con más de 300 modelos, con créditos gratuitos, un tiempo de actividad del 99,99% y sin necesidad de verificación de organización de OpenAI.

Ver Serie

Google

Los modelos creativos más potentes de Google están todos disponibles en Atlas Cloud. Veo 3.1 ofrece generación de video cinematográfico, Nano Banana 2 impulsa la creación de imágenes de alta fidelidad y Gemini aporta inteligencia multimodal a cada flujo de trabajo. Acceda a la suite completa de modelos de Google a través de una sola API key con disponibilidad Day-0 y precios de pago por uso (pay-as-you-go).

Ver Serie

Seedance 2.0 Mini

Seedance 2.0 Mini lleva la generación de video multimodal de ByteDance a los flujos de trabajo donde la velocidad y el costo son más importantes. Ofrece las capacidades principales de Seedance 2.0 con un menor consumo de recursos: generación más rápida, menor costo por video y la misma integración de API que ya utiliza. Para los equipos que ejecutan pipelines de alto volumen o crean prototipos a escala, Mini es la opción predeterminada práctica.

Ver Serie

ByteDance

Desde la generación de video cinematográfico hasta la creación de imágenes de alta fidelidad, los modelos más potentes de ByteDance están disponibles en Atlas Cloud. Ejecute Seedance y Seedream a gran escala con los precios de inferencia más bajos y cero gastos generales de infraestructura.

Ver Serie

Alibaba

Atlas Cloud reúne toda la línea de modelos de Alibaba bajo una sola API: Qwen para tareas de lenguaje e imagen, y Wan para la generación de video hasta 1080p. Acceda a cada modelo con pago por uso sin suscripciones. La API de Alibaba está disponible a través de una única URL base utilizando su cliente compatible con OpenAI existente.

Ver Serie

OpenAI

Atlas Cloud le ofrece acceso a la línea completa de la API de OpenAI, desde GPT Image 2 para la generación de imágenes hasta Sora 2 para video. Cada modelo está disponible bajo la modalidad de pago por uso sin compromiso mensual. Intégrelo cambiando simplemente la URL base mediante la API compatible con OpenAI.

Ver Serie

xAI

Construya pipelines completos de imágenes y video utilizando la xAI API en Atlas Cloud. Genere en 2K, edite con imágenes de referencia y anime imágenes en clips sincronizados con audio.

Ver Serie

Kwaivgi

La API de Kwaivgi a un 15% por debajo del precio estándar. Atlas Cloud ofrece acceso Day-0 a los nuevos lanzamientos de Kling con precios de pago por uso y sin límites de puestos. Una cuenta, una clave, todos los modelos de Kling desde el nivel estándar hasta el nivel maestro.

Ver Serie

Seedream 5.0 Pro

La API de Seedream 5.0 Pro ofrece a los desarrolladores el modelo de edición de imágenes controlable de ByteDance en Atlas Cloud. Sitúa las ediciones con precisión mediante anclajes y coordenadas, separa las imágenes en capas editables, fusiona múltiples referencias y empareja colores y materiales exactos, con texto multilingüe a 2K y 3K. ¡En Atlas Cloud puede acceder a él mediante una sola clave!

Ver Serie