在人工智能領域的一次重大突破中,MiniMax公司于近日震撼發布了全球首個開源大規模混合架構推理模型——MiniMax-M1。這一發布不僅標志著AI技術的新里程碑,還伴隨著一項為期五天的連續更新計劃,引起了業界的廣泛關注。
MiniMax-M1的參數規模達到了驚人的4560億,每個token能激活459億參數,支持長達100萬的上下文輸入,以及業內最長的8萬token推理輸出。這一能力不僅與閉源模型巨頭谷歌Gemini 2.5 Pro持平,更是DeepSeek-R1的8倍之多。為了滿足不同需求,MiniMax還訓練了兩個版本的M1模型,思考預算分別為40K和80K。
在標準基準測試集上的對比結果顯示,MiniMax-M1在復雜的軟件工程、工具使用以及長上下文任務方面,均展現出了優于DeepSeek-R1和Qwen3-235B等開源模型的表現。這一成就不僅得益于其龐大的參數規模,更在于其獨特的混合架構和高效算法。
在M1的研發過程中,MiniMax團隊采用了創新的強化學習方法。據透露,整個強化學習階段使用了512塊H800訓練了三周,租賃成本僅為53.74萬美金(折合人民幣約385.9萬元),遠低于最初的成本預期。這一高效的成本控制策略,無疑為M1的成功發布奠定了堅實基礎。
對于用戶而言,MiniMax-M1提供了極大的便利。在MiniMax APP和Web平臺上,用戶可以不限量免費使用M1。而在API價格方面,MiniMax也提供了多種選擇。對于0-32k的輸入長度,輸入價格為0.8元/百萬token,輸出價格為8元/百萬token;對于32k-128k的輸入長度,輸入價格為1.2元/百萬token,輸出價格為16元/百萬token;對于128k-1M的輸入長度,輸入價格為2.4元/百萬token,輸出價格為24元/百萬token。與DeepSeek-R1相比,M1在第三檔價格上展現出了絕對優勢,因為DeepSeek-R1并不支持如此長的輸入長度。
在評測方面,MiniMax-M1在軟件工程、長上下文和工具使用等方面的表現尤為突出。在OpenAI發布的MRCR測試集中,M1雖然略遜于Gemini 2.5 Pro,但相比其他模型仍具有明顯優勢。在評估軟件工程能力的SWE-bench Verified測試集中,M1的表現也僅次于DeepSeek-R1-0528。特別是在航空業的TAU-bench(airline)測試集中,M1的表現優于所有其他開源和閉源模型。然而,在數學和編程能力方面,M1的得分相對較低,仍有提升空間。
MiniMax-M1的成功發布,不僅展示了MiniMax在AI技術方面的深厚積累,更為整個行業帶來了新的發展機遇。隨著AI技術的不斷進步和應用場景的不斷拓展,MiniMax-M1有望在未來發揮更大的作用,推動人工智能技術的持續創新和發展。