国产98在线 | 传媒麻豆,久久―日本道色综合久久,久久久精品久久久久久久久久久,国产成人精品免费久久久久,五月综合色婷婷影院在线观看,久久久亚洲精品视频

  • 虎科技 - 領先的互聯網科技媒體

DeepSeek V3.1大模型升級,適配國產新芯片,性能顯著提升

   時間:2025-08-24 00:45 來源:ITBEAR作者:馮璃月

中國人工智能領域的明星企業DeepSeek近期宣布了其旗艦大語言模型的重大更新,新版本針對即將面世的新一代國產芯片進行了專門優化。

據DeepSeek介紹,此次升級采用了名為UE8M0的新型數據類型來訓練V3.1模型,這是對現有FP8格式的一種擴展,已被英偉達等業界巨頭所支持。DeepSeek在微信平臺上澄清,這一變化是為了更好地適配即將推出的國產芯片,指出“UE8M0 FP8專為新一代國產芯片設計”。

使用較低精度的數據類型帶來了諸多優勢,包括減少內存占用和提升推理及訓練速度。值得注意的是,DeepSeek之前已經在使用FP8格式中的E4M3類型。因此,轉向UE8M0更多是為了確保與新一代芯片的兼容性,而非單純追求效率提升。

雖然DeepSeek未透露新模型所適配芯片的具體制造商,但有報道稱這家AI初創公司與華為有著緊密合作,利用華為的昇騰系列神經處理單元(NPU)進行模型訓練和推理。華為的昇騰910C為其CloudMatrix機架系統提供動力,但目前不支持FP8格式,這或許意味著華為正在研發性能更強大的加速器。

有消息指出,DeepSeek曾嘗試在華為昇騰加速器上訓練其下一代R2模型,但因遇到困難而改用英偉達的H20加速器。不過,DeepSeek目前仍在評估華為加速器的推理性能。

關于R2模型,目前尚不清楚它是否就是此次發布的V3.1版本,或是另一個即將推出的模型。

值得注意的是,DeepSeek V3.1并非從零開始的全新模型,而是基于早期V3版本的檢查點進一步訓練而成。盡管如此,這一新版本在功能上有顯著改進。V3.1版本不再區分“思考型”和“非思考型”模型,而是將兩種范式整合到單一模型中,并通過聊天模板實現模式切換。因此,DeepSeek的聊天機器人界面也不再提及R1版本。

統一模型以支持推理和非推理輸出的概念并非DeepSeek首創。阿里巴巴今年早些時候也曾嘗試過類似做法,但因發現該功能降低了模型質量而放棄。然而,在基準測試中,DeepSeek的V3.1版本似乎成功避免了這一問題。與V3版本相比,V3.1的非思考模式在各項指標上都有顯著提升。

在啟用思考功能后,V3.1版本的性能提升雖然相對溫和,但DeepSeek指出,該模型現在需要更少的思考Token就能給出答案,這將有助于降低模型服務的成本。

在上下文處理能力方面,DeepSeek將V3.1版本的上下文窗口(即短期記憶)從65,536個Token擴展到131,072個,盡管這一數字仍然落后于阿里巴巴的Qwen3等其他中國模型,后者能處理高達百萬級的Token上下文。

DeepSeek還聲稱在工具和函數調用能力方面取得了重大進展,這對于需要實時檢索外部數據和調用工具的AI工作負載至關重要。例如,在針對自主瀏覽器使用任務的Browsecomp基準測試中,DeepSeek V3.1版本獲得了30分的高分,而R1版本的5月版本僅得8.9分。

除了通過聊天機器人服務和API端點提供服務外,DeepSeek還在Hugging Face和ModeScope平臺上提供了基礎模型和指令調優模型的權重下載,方便開發者進一步定制和優化。

關于DeepSeek V3.1版本的更多信息,以下是幾個常見問題及解答:

Q:DeepSeek V3.1有哪些新特點?

A:V3.1版本最大的特點是使用UE8M0數據類型進行優化,專為即將發布的國產芯片設計。同時,它整合了“思考型”和“非思考型”模型功能,在單一模型中通過聊天模板實現模式切換,并將上下文窗口的Token數量大幅提升。

Q:為什么DeepSeek要切換到UE8M0數據類型?

A:DeepSeek切換到UE8M0主要是為了與即將推出的新一代國產芯片保持兼容。盡管公司之前已在使用FP8的E4M3類型,但UE8M0是專為新一代國產芯片設計的,預示著可能有更強大的國產加速器即將面世。

Q:DeepSeek V3.1版本的性能如何?

A:在基準測試中,V3.1版本的非思考模式相比V3版本在各項指標上都有顯著提升。在工具調用方面,V3.1版本在Browsecomp瀏覽器任務測試中得分高達30分,遠超R1版本的8.9分。同時,該模型現在需要更少的思考Token就能給出答案,有助于降低服務成本。

 
 
更多>同類內容
推薦圖文
推薦內容
點擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數碼群

主站蜘蛛池模板: | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | |