首页
探索
MiniMax LLM Models
minimaxai/minimax-m2.1
MiniMax M2.1
LLM

MiniMax M2.1 API by MiniMax

minimaxai/minimax-m2.1
Minimax-m2.1

MiniMax-M2.1 is a lightweight, state-of-the-art large language model optimized for coding, agentic workflows, and modern application development. With only 10 billion activated parameters, it delivers a major jump in real-world capability while maintaining exceptional latency, scalability, and cost efficiency.

参数

代码示例

import os
from openai import OpenAI

client = OpenAI(
    api_key=os.getenv("ATLASCLOUD_API_KEY"),
    base_url="https://api.atlascloud.ai/v1"
)

response = client.chat.completions.create(
    model="minimaxai/minimax-m2.1",
    messages=[
    {
        "role": "user",
        "content": "hello"
    }
],
    max_tokens=1024,
    temperature=0.7
)

print(response.choices[0].message.content)

安装

安装所需的依赖包。

bash
pip install requests

认证

所有 API 请求需要通过 API Key 进行认证。您可以在 Atlas Cloud 控制台获取 API Key。

bash
export ATLASCLOUD_API_KEY="your-api-key-here"

HTTP 请求头

python
import os

API_KEY = os.environ.get("ATLASCLOUD_API_KEY")
headers = {
    "Content-Type": "application/json",
    "Authorization": f"Bearer {API_KEY}"
}
保护好您的 API Key

切勿在客户端代码或公开仓库中暴露您的 API Key。请使用环境变量或后端代理。

提交请求

import requests

url = "https://api.atlascloud.ai/v1/chat/completions"
headers = {
    "Content-Type": "application/json",
    "Authorization": "Bearer $ATLASCLOUD_API_KEY"
}
data = {
    "model": "your-model",
    "messages": [{"role": "user", "content": "Hello"}],
    "max_tokens": 1024
}

response = requests.post(url, headers=headers, json=data)
print(response.json())

Input Schema

以下参数在请求体中被接受。

总计: 9必填: 2可选: 7
modelstringrequired
The model ID to use for the completion.
Example: "minimaxai/minimax-m2.1"
messagesarray[object]required
A list of messages comprising the conversation so far.
rolestringrequired
The role of the message author. One of "system", "user", or "assistant".
systemuserassistant
contentstringrequired
The content of the message.
max_tokensinteger
The maximum number of tokens to generate in the completion.
Default: 1024Min: 1
temperaturenumber
Sampling temperature between 0 and 2. Higher values make output more random, lower values more focused and deterministic.
Default: 0.7Min: 0Max: 2
top_pnumber
Nucleus sampling parameter. The model considers the tokens with top_p probability mass.
Default: 1Min: 0Max: 1
streamboolean
If set to true, partial message deltas will be sent as server-sent events.
Default: false
stoparray[string]
Up to 4 sequences where the API will stop generating further tokens.
frequency_penaltynumber
Penalizes new tokens based on their existing frequency in the text so far. Between -2.0 and 2.0.
Default: 0Min: -2Max: 2
presence_penaltynumber
Penalizes new tokens based on whether they appear in the text so far. Between -2.0 and 2.0.
Default: 0Min: -2Max: 2

请求体示例

json
{
  "model": "minimaxai/minimax-m2.1",
  "messages": [
    {
      "role": "user",
      "content": "Hello"
    }
  ],
  "max_tokens": 1024,
  "temperature": 0.7,
  "stream": false
}

Output Schema

API 返回兼容 ChatCompletion 的响应格式。

idstringrequired
Unique identifier for the completion.
objectstringrequired
Object type, always "chat.completion".
Default: "chat.completion"
createdintegerrequired
Unix timestamp of when the completion was created.
modelstringrequired
The model used for the completion.
choicesarray[object]required
List of completion choices.
indexintegerrequired
Index of the choice.
messageobjectrequired
The generated message.
finish_reasonstringrequired
The reason generation stopped.
stoplengthcontent_filter
usageobjectrequired
Token usage statistics.
prompt_tokensintegerrequired
Number of tokens in the prompt.
completion_tokensintegerrequired
Number of tokens in the completion.
total_tokensintegerrequired
Total tokens used.

响应示例

json
{
  "id": "chatcmpl-abc123",
  "object": "chat.completion",
  "created": 1700000000,
  "model": "model-name",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "Hello! How can I assist you today?"
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 10,
    "completion_tokens": 20,
    "total_tokens": 30
  }
}

Atlas Cloud Skills

Atlas Cloud Skills 将 300+ AI 模型直接集成到您的 AI 编程助手中。一条命令安装,即可用自然语言生成图像、视频和与 LLM 对话。

支持的客户端

Claude Code
OpenAI Codex
Gemini CLI
Cursor
Windsurf
VS Code
Trae
GitHub Copilot
Cline
Roo Code
Amp
Goose
Replit
40+ 支持的客户端

安装

bash
npx skills add AtlasCloudAI/atlas-cloud-skills

设置 API Key

从 Atlas Cloud 控制台获取 API Key,并将其设置为环境变量。

bash
export ATLASCLOUD_API_KEY="your-api-key-here"

功能

安装后,您可以在 AI 助手中使用自然语言访问所有 Atlas Cloud 模型。

图像生成使用 Nano Banana 2、Z-Image 等模型生成图像。
视频创作使用 Kling、Vidu、Veo 等模型从文本或图像创建视频。
LLM 对话与 Qwen、DeepSeek 等大语言模型对话。
媒体上传上传本地文件用于图像编辑和图生视频工作流。

MCP Server

Atlas Cloud MCP Server 通过 Model Context Protocol 将您的 IDE 与 300+ AI 模型连接。支持任何兼容 MCP 的客户端。

支持的客户端

Cursor
VS Code
Windsurf
Claude Code
OpenAI Codex
Gemini CLI
Cline
Roo Code
100+ 支持的客户端

安装

bash
npx -y atlascloud-mcp

配置

将以下配置添加到您的 IDE 的 MCP 设置文件中。

json
{
  "mcpServers": {
    "atlascloud": {
      "command": "npx",
      "args": [
        "-y",
        "atlascloud-mcp"
      ],
      "env": {
        "ATLASCLOUD_API_KEY": "your-api-key-here"
      }
    }
  }
}

可用工具

atlas_generate_image从文本提示生成图像。
atlas_generate_video从文本或图像创建视频。
atlas_chat与大语言模型对话。
atlas_list_models浏览 300+ 可用 AI 模型。
atlas_quick_generate一步式内容创建,自动选择最佳模型。
atlas_upload_media上传本地文件用于 API 工作流。

MiniMax M2.1 - 业界领先的编程大语言模型

2025年12月发布

230B 参数 MoE 架构,专为真实开发场景和 AI 智能体设计

MiniMax M2.1 是一款专为多语言编程和真实复杂任务打造的增强型大语言模型。采用稀疏混合专家(MoE)架构,总参数量达 230B,每个 token 仅激活 10B 参数,在 SWE-bench Verified 上达到 74% 的准确率,而成本仅为每百万 token 0.30 美元——比 Claude Sonnet 4.5(3.00 美元/百万 token)节省 90% 成本。于 2025 年 12 月 23 日以 MIT 许可证发布,在多文件编辑、原生移动开发和 AI 智能体工作流方面表现卓越,支持 Claude Code、Droid、Cline 等工具。

230B
总参数量
10B
激活参数
74%
SWE-Bench Verified
90%
成本节省 vs Claude
多语言编程卓越性能
  • 在 Rust、Java、Golang、C++、Kotlin、Objective-C 等语言上表现业界领先
  • 在 SWE-Multilingual 任务上达到 72.5%,在非 Python 语言上超越竞品
  • 性能超过 Claude Sonnet 4.5,接近 Claude Opus 4.5
  • 原生支持 TypeScript、JavaScript 和现代 Web 框架
智能体与工具集成
  • 在 Claude Code、Droid (Factory AI)、Cline、Kilo Code 上表现卓越
  • 在 Roo Code、BlackBox 等智能体框架中提供一致的优秀结果
  • 专为编码-运行-修复循环和测试验证修复而设计
  • 在 Terminal-Bench 任务上表现强劲
全栈开发能力
  • VIBE 综合基准测试平均得分 88.6%
  • VIBE-Web 91.5%,VIBE-Android 89.7%
  • VIBE-iOS 88.0%,VIBE-Backend 86.7%
  • 系统性增强了设计理解和美学表达能力
高性价比
  • 每百万输入 token 仅需 0.30 美元,Claude 需 3.00 美元
  • 在保持竞争力性能的同时节省 90% 成本
  • 响应更简洁,生成速度更快
  • 相比 M2 版本,token 消耗显著降低

业界领先的性能表现

MiniMax M2.1 在所有主要编程基准测试中都达到了竞争水平,同时实现了显著的成本节省

SWE-Bench Verified

74.0%

达到 74.0% 准确率,与 Claude Sonnet 4.5 性能持平,但成本降低 90%

Multi-SWE-Bench

49.4%

得分 49.4%,超越 Claude Sonnet 4.5 (44.3%)、Gemini 1.5 Pro 等业界领先模型

SWE-Multilingual

72.5%

在多语言任务中达到 72.5%,在 Rust、Go、Java 等非 Python 语言上表现卓越

VIBE 全栈基准测试

88.6%

平均得分 88.6,其中 Web 91.5%、Android 89.7%、iOS 88.0%、Backend 86.7%

竞品对比 (Multi-SWE-Bench)

MiniMax M2.149.4%领先
Claude Sonnet 4.544.3%落后
Claude Opus 4.550.0%领先

技术架构

稀疏混合专家架构

采用 230B 总参数的 MoE Transformer 架构,每个 token 推理时仅激活 10B 参数,在不牺牲能力的前提下最大化效率

效率提升

相比 M2 版本,提供更简洁的模型响应和思维链,响应速度显著加快,token 消耗明显降低

长程推理能力

展现出卓越的长程推理能力,能够在不丢失上下文的情况下规划和执行多步骤任务

完美适用场景

💻
多文件代码编辑
🧪
测试驱动开发
📱
跨平台开发
🤖
AI 智能体工作流
🌐
全栈 Web 开发
📊
代码审查与优化

技术规格

架构稀疏混合专家 (MoE)
总参数量2300 亿
激活参数每个 Token 100 亿
发布日期2025 年 12 月 23 日
许可证MIT 许可证(允许商用)
API 定价$0.30/1M输入 Token
上下文窗口可变(查看 API 文档)
部署方式API + HuggingFace 权重

为什么选择 Atlas Cloud 使用 MiniMax M2.1?

通过我们完全托管的 MiniMax M2.1 API 服务,体验企业级可靠性、安全性和成本效益。

极具竞争力的价格

按需付费,价格透明。无隐藏费用,无最低承诺。免费开始使用。

99.9% 正常运行时间 SLA

企业级基础设施,具有自动故障转移、负载均衡和全天候监控,确保最高可靠性。

SOC 2 Type II 认证

企业级安全性,具有 SOC 2 Type II 认证。您的数据在传输和存储过程中均已加密,符合行业领先的安全标准。

闪电般的响应速度

全球 CDN,在全球设有边缘节点。优化的推理基础设施可提供亚秒级响应时间。

专业技术支持

全天候专业技术支持团队。获得集成、优化和故障排除方面的帮助。

统一 API 平台

通过一个一致的 API 访问 300 多个 AI 模型(LLM、图像、视频、音频)。一次集成满足所有 AI 需求。

准备好使用 MiniMax M2.1 开发了吗?

体验业界领先的编程能力,同时节省 90% 成本。通过 API 和开源部署方式均可使用。

业界领先的多语言支持
相比竞品节省 90% 成本
MIT 许可证支持商用

探索类似模型

300+ 模型,即刻开启,

探索全部模型

Join our Discord community

Join the Discord community for the latest model updates, prompts, and support.