近日,人工智能領(lǐng)域再度傳來重大進(jìn)展,DeepSeek R1模型在5月28日悄然完成了小版本迭代,新版本被命名為DeepSeek-R1-0528。用戶只需通過官方渠道,無論是網(wǎng)站、App還是小程序,開啟“深度思考”功能,即可率先體驗(yàn)這一升級(jí)后的智能服務(wù)。同時(shí),API接口也已同步更新,保持原有調(diào)用方式不變,確保了用戶體驗(yàn)的連貫性。
緊接著,5月29日晚間,深度求索官方詳細(xì)披露了DeepSeek-R1-0528版本的升級(jí)亮點(diǎn)。本次升級(jí)的核心在于深度思考能力的顯著增強(qiáng)。雖然依舊基于2024年12月發(fā)布的DeepSeek V3 Base模型,但通過加大后訓(xùn)練過程中的算力投入,模型的思維深度和推理能力實(shí)現(xiàn)了質(zhì)的飛躍。在數(shù)學(xué)、編程及通用邏輯等多個(gè)關(guān)鍵測評(píng)中,DeepSeek-R1-0528的表現(xiàn)已躋身國內(nèi)頂尖行列,甚至逼近國際知名模型如o3和Gemini-2.5-Pro的水平。
具體而言,新版R1模型在復(fù)雜推理任務(wù)上的表現(xiàn)尤為突出。以AIME 2025測試為例,其準(zhǔn)確率從舊版的70%大幅提升至87.5%。這一顯著進(jìn)步得益于模型在推理過程中思維深度的增加,新版模型在解題時(shí)平均使用23K tokens,遠(yuǎn)高于舊版的12K tokens,顯示出更為細(xì)致和深入的解題策略。
深度求索官方還通過蒸餾DeepSeek-R1-0528的思維鏈,訓(xùn)練出了DeepSeek-R1-0528-Qwen3-8B模型。在數(shù)學(xué)測試AIME 2024中,該8B模型緊隨DeepSeek-R1-0528之后,表現(xiàn)優(yōu)于Qwen3-8B達(dá)10%,與Qwen3-235B相媲美。這一成果不僅對(duì)學(xué)術(shù)界推理模型的研究具有啟示意義,也為工業(yè)界小模型的開發(fā)提供了新的思路。
除了深度思考能力的增強(qiáng),新版DeepSeek R1還在其他方面進(jìn)行了優(yōu)化。針對(duì)“幻覺”問題,新版模型在改寫潤色、總結(jié)摘要、閱讀理解等場景中,幻覺率降低了約45%至50%,提供了更為準(zhǔn)確可靠的結(jié)果。在創(chuàng)意寫作方面,新版R1能夠生成篇幅更長、結(jié)構(gòu)更完整、風(fēng)格更接近人類偏好的作品,覆蓋了議論文、小說、散文等多種文體。雖然目前不支持在深度思考過程中直接調(diào)用工具,但DeepSeek-R1-0528在Tau-Bench測評(píng)中的表現(xiàn)已與OpenAI o1-high相當(dāng)。
騰訊官方也迅速響應(yīng),宣布旗下元寶、ima、搜狗輸入法、QQ瀏覽器等產(chǎn)品迎來升級(jí),率先接入了DeepSeek R1-0528最新版。這些產(chǎn)品在推理能力、代碼生成、寫作表現(xiàn)、思考邏輯等方面均得到了顯著提升。用戶只需打開相應(yīng)產(chǎn)品,選擇DeepSeek模型R1深度思考功能,即可免費(fèi)不限量體驗(yàn)這一智能升級(jí)。騰訊表示,從模型開源到產(chǎn)品上線,整個(gè)過程不到一天時(shí)間,展現(xiàn)了其在人工智能領(lǐng)域的快速響應(yīng)和部署能力。