近日,DeepSeek官方宣布其線上版本模型已成功升級至DeepSeek V3.1,此次升級的一大亮點是上下文窗口從原先的64k擴展到了128k,用戶現在可以在網頁、App以及小程序中體驗到這一新版模型。
值得注意的是,DeepSeek在App和網頁端的界面上也做了一些調整,將原先的“深度思考(R1)”字樣簡化為“深度思考”。這一變化引發了網友們的猜測,認為這是DeepSeek可能正在融合推理模型與非推理模型的信號。然而,截至目前,DeepSeek官方尚未就此發表任何正式聲明。
新版與舊版界面的對比圖顯示,左側為舊版頁面,右側則是新版頁面,變化一目了然。
DeepSeek V3.1模型已經上傳至Hugging Face平臺,目前開源的是未經指令微調的Base版本,包括配置文件、腳本代碼和模型權重等均可供用戶下載。與之前的DeepSeek-V3-0324版本相比,新模型的參數量和張量類型并未發生顯著變化。
在實際體驗中,DeepSeek V3.1在多個方面展現出了能力的提升。例如,在編程領域,尤其是前端開發方面,新模型能夠生成更長、更復雜的代碼,并且在美觀性和完成度上也有了顯著提升。當要求設計一個具有科技感的個人博客網站時,DeepSeek V3.1不僅提供了更為豐富的網站欄目規劃,還加入了圖片等元素,使得整個網頁的布局更為合理,重點更為突出。
DeepSeek V3.1在小游戲開發方面也表現出了一定的實力。盡管在復現Chrome瀏覽器斷網時的小恐龍游戲時,新模型打造的小恐龍外觀并未完全還原,且游戲可玩性有待提高,但從頁面的畫風和游戲規則來看,這一小游戲已經與原版頗為相似。
在回答小眾歷史問題時,DeepSeek V3.1也展現出了其嚴謹性。當被問及“布須曼人喝牛奶嗎”這一涉及非洲南部少數民族的問題時,新模型不僅提供了更為詳細的信息,而且在經過事實核查后,這些細節也基本得到了印證,避免了胡編亂造的情況。
在回答關于馬斯克和OpenAI CEO Sam Altman誰更牛的問題時,DeepSeek V3.1雖然認為馬斯克更牛,但也給Altman送上了一番夸贊,避免了非黑即白的結論,顯得更為客觀和中立。
在詩歌創作方面,DeepSeek V3.1依然保持著其獨特的風格,充滿了各種比喻和類比,讓人耳目一新。而在數學能力上,盡管新模型在解答基礎算術題時過程有些曲折,但最終還是給出了正確答案,展現出了其強大的計算能力。
DeepSeek V3.1的上線也引發了網友們的熱議。有AI博主表示,新模型打造的小球跳動效果更加符合物理定律,且提供了重力、摩擦、旋轉速度、彈跳等可調整的參數,使得效果更為逼真。還有網友讓DeepSeek V3.1為自己打造了一幅自畫像,雖然畫風獨特,但也別有一番風味。