法國人工智能新興勢力Mistral近日宣布,正式涉足推理人工智能模型領域,并于6月10日推出了其首個推理模型系列——Magistral。這一舉動標志著Mistral在人工智能領域邁出了重要一步,與OpenAI的o3模型和谷歌的Gemini 2.5 Pro等業界知名推理模型展開了競爭。
Magistral系列包含兩個版本:Magistral Small和Magistral Medium。其中,Magistral Small擁有240億參數,已在Hugging Face平臺上以開源形式發布,采用Apache 2.0許可證。而Magistral Medium則是一個功能更為強大的模型,目前仍處于預覽階段,僅通過Mistral的Le Chat聊天平臺、公司API及第三方合作伙伴云平臺提供服務。
Mistral在官方博客中表示,Magistral系列模型專為解決多步驟問題而設計,旨在提高數學、物理等學科領域的一致性和可靠性。這些模型經過精心微調,適用于結構化計算、程序化邏輯、決策樹和基于規則的系統等多種企業級應用場景。同時,它們還能提供可追溯的思考過程,增強模型的可解釋性。
成立于2023年的Mistral,是一家專注于前沿模型開發的人工智能實驗室。除了Le Chat和移動應用程序外,Mistral還致力于開發一系列人工智能驅動的服務。憑借General Catalyst等風險投資機構的支持,Mistral已籌集超過11億歐元(約合90.22億元人民幣)的資金。
盡管Mistral在資源方面頗具優勢,但在推理模型開發領域,它仍落后于一些領先的人工智能實驗室。從Mistral自己的基準測試結果來看,Magistral在GPQA Diamond和AIME等評估模型物理、數學和科學技能的測試中,表現不如Gemini 2.5 Pro和Anthropic的Claude Opus 4。同時,在流行的編程基準測試LiveCodeBench中,Magistral也未能超越Gemini 2.5 Pro。
然而,Mistral并未因此氣餒。在其博客文章中,Mistral著重強調了Magistral的其他優勢。據稱,Magistral在Le Chat上的答題速度是競爭對手的10倍,并支持多種語言,包括意大利語、阿拉伯語、俄語和簡體中文。這使得Magistral在處理多語言問題時具有更高的靈活性和適應性。
Mistral在文章中進一步指出,Magistral專為研究、戰略規劃、運營優化和數據驅動決策而設計。無論是執行多因素風險評估和建模,還是在約束條件下計算最優交付窗口,Magistral都能展現出卓越的性能。這使得Magistral成為企業在進行復雜決策時的有力助手。
值得注意的是,Magistral的發布正值Mistral推出“氛圍編程”客戶端Mistral Code后不久。此前,Mistral還發布了多個專注于編程的模型,并推出了面向企業的聊天服務Le Chat Enterprise。該服務提供了人工智能代理構建器等工具,并將Mistral的模型與Gmail、SharePoint等第三方服務進行了集成。這一系列舉措進一步展示了Mistral在人工智能領域的實力和雄心。