DeepSeek近日宣布了其V3.1模型的重大更新及價格調整策略,這一消息迅速在用戶群體中引起了廣泛關注。
新版本V3.1的核心升級在于引入了混合推理架構,這一創新使得單個模型能夠靈活切換至思考模式或非思考模式,極大地豐富了用戶的使用場景。相較于前代DeepSeek-R1-0528,DeepSeek-V3.1-Think在思考效率上實現了顯著提升,能夠在更短時間內提供精準答案。
通過Post-Training優化技術,V3.1在工具使用與智能體任務中的表現也取得了長足進步,展現了更強大的Agent能力。官方App與網頁端已同步完成升級,用戶只需點擊“深度思考”按鈕,即可輕松切換模式。
API方面,DeepSeek同樣進行了全面升級?!癲eepseek-chat”對應非思考模式,而“deepseek-reasoner”則對應思考模式,且兩者上下文長度均擴展至128K,為用戶提供了更廣闊的信息處理空間。同時,為了兼容更多框架,V3.1還增加了對Anthropic API格式的支持,方便用戶將其能力接入Claude Code框架。
然而,與這些令人振奮的升級一同到來的,還有價格調整的通知。DeepSeek宣布取消了之前的夜間優惠活動,V3.1的輸入(緩存未命中)/百萬tokens價格較V3版本上漲了200%,輸出/百萬tokens價格也上漲了150%。這一變動引發了部分用戶的熱議,有人調侃道:“以后加班研發,連優惠都沒了?!?/p>
盡管價格有所上漲,但DeepSeek-V3.1在性能上的提升足以證明其價值。在AIME2025數學競賽測試中,V3.1的準確率提升至87.5%,遠超舊版R1的70%。在LiveCodeBench編程測試中,V3.1的表現幾乎與OpenAI的o3-high持平,展現出了卓越的編程實力。
在市場上,DeepSeek-V3.1的價格相較于同類頭部AI模型仍保持了較高的性價比。根據Artificial Analysis的最新排名,DeepSeek-V3.1已躍升至第13位,超越了Claude 4 Sonnet Thinking、Gemini 2.5 Flash、o3-mini等多個競爭對手。
DeepSeek還將V3.1定位為“邁向Agent時代的第一步”,明確表達了其在AI Agent領域的發力決心。通過官方測試,V3.1在代碼修復、命令行終端復雜任務等多個方面均表現出色,相較于前代模型有了顯著提升。同時,在多項搜索評測指標上,V3.1也取得了優異成績,展現了其在多步推理和跨學科難題解決方面的強大能力。
V3.1在非思考模式下的輸出長度也得到了有效控制,能夠在保持模型性能的同時減少輸出長度,提升了用戶體驗。在公告的結尾處,DeepSeek還留下了一個彩蛋:“UE8M0 FP8是針對即將發布的下一代國產芯片設計?!边@一消息無疑為用戶們留下了更多的想象空間。