MiniMax-M2.1 is a lightweight, state-of-the-art large language model optimized for coding, agentic workflows, and modern application development. With only 10 billion activated parameters, it delivers a major jump in real-world capability while maintaining exceptional latency, scalability, and cost efficiency.
MiniMax-M2.1 is a lightweight, state-of-the-art large language model optimized for coding, agentic workflows, and modern application development. With only 10 billion activated parameters, it delivers a major jump in real-world capability while maintaining exceptional latency, scalability, and cost efficiency.
Kiến Trúc MoE 230B Tham Số cho Phát Triển Thực Tế & Tác Nhân AI
MiniMax M2.1 là một mô hình ngôn ngữ lớn được cải tiến, được xây dựng cho lập trình đa ngôn ngữ và các tác vụ phức tạp trong thực tế. Với kiến trúc Mixture-of-Experts (MoE) thưa thớt có tổng số 230B tham số và chỉ 10B tham số hoạt động mỗi token, nó đạt 74% trên SWE-bench Verified với chi phí khoảng $0.30/1M token—tiết kiệm 90% chi phí so với Claude Sonnet 4.5 ($3.00/1M). Được phát hành theo giấy phép MIT vào ngày 23 tháng 12 năm 2025, nó xuất sắc trong chỉnh sửa nhiều tệp, phát triển di động gốc và quy trình làm việc của tác nhân AI trên các công cụ như Claude Code, Droid, Cline và nhiều hơn nữa.
MiniMax M2.1 đạt hiệu suất cạnh tranh trên tất cả các benchmark lập trình chính trong khi mang lại tiết kiệm chi phí đáng kể
Đạt độ chính xác 74.0%, khớp với hiệu suất Claude Sonnet 4.5 với chi phí thấp hơn 90%
Điểm số 49.4%, vượt trội Claude Sonnet 4.5 (44.3%), Gemini 1.5 Pro và các nhà lãnh đạo ngành khác
Đạt 72.5% trong các tác vụ đa ngôn ngữ, xuất sắc trong Rust, Go, Java và các ngôn ngữ không phải Python khác
Điểm trung bình 88.6 trên Web (91.5%), Android (89.7%), iOS (88.0%) và Backend (86.7%)
Sử dụng kiến trúc transformer MoE với 230B tham số tổng, trong đó chỉ 10B tham số được sử dụng tích cực trong quá trình suy luận cho mỗi token, tối đa hóa hiệu quả mà không hy sinh khả năng
Cung cấp phản hồi mô hình và chuỗi suy nghĩ ngắn gọn hơn so với M2, với tốc độ phản hồi nhanh hơn đáng kể và mức tiêu thụ token giảm đáng kể
Thể hiện khả năng suy luận tầm xa đặc biệt, lập kế hoạch và thực hiện các tác vụ nhiều bước mà không bị mất ngữ cảnh
Trải nghiệm độ tin cậy, bảo mật và hiệu quả chi phí cấp doanh nghiệp với dịch vụ API MiniMax M2.1 được quản lý hoàn toàn của chúng tôi.
Giá trả theo mức sử dụng với chi phí minh bạch. Không có phí ẩn, không có cam kết tối thiểu. Bắt đầu miễn phí.
Cơ sở hạ tầng cấp doanh nghiệp với chuyển đổi dự phòng tự động, cân bằng tải và giám sát 24/7 để đảm bảo độ tin cậy tối đa.
Bảo mật cấp doanh nghiệp với chứng nhận SOC 2 Type II. Dữ liệu của bạn được mã hóa khi truyền tải và lưu trữ theo các tiêu chuẩn bảo mật hàng đầu trong ngành.
CDN toàn cầu với các vị trí edge trên toàn thế giới. Cơ sở hạ tầng suy luận được tối ưu hóa mang lại thời gian phản hồi dưới một giây.
Đội ngũ hỗ trợ kỹ thuật chuyên dụng có sẵn 24/7. Nhận trợ giúp về tích hợp, tối ưu hóa và khắc phục sự cố.
Truy cập hơn 300 mô hình AI (LLM, hình ảnh, video, âm thanh) thông qua một API nhất quán. Tích hợp duy nhất cho tất cả nhu cầu AI của bạn.
Trải nghiệm khả năng lập trình tiên tiến với tiết kiệm 90% chi phí. Có sẵn qua API và triển khai mã nguồn mở.
Chỉ có tại Atlas Cloud.