近期,人工智能領域迎來了一項新進展。在8月20日前后,DeepSeek公司在Hugging Face平臺上正式公布了其最新模型——V3.1-Base。據悉,這款新模型在上下文處理能力上實現了顯著提升,能夠處理長達128K的文本內容,其參數規模更是達到了約6850億。
為了直觀展示這一成果,DeepSeek還附上了一張圖片,展示了模型的相關信息和性能參數。盡管圖片內容未能在此直接展示,但感興趣的讀者可以通過訪問DeepSeek在Hugging Face上的頁面,親自查看這張充滿技術細節的圖像。
除了在線上平臺發布新模型外,DeepSeek還宣布了其線上模型版本已升級至V3.1,同樣具備處理128K長度上下文的能力。用戶現在可以通過DeepSeek的官方網站、應用程序以及小程序進行測試,而API接口的調用方式則保持不變,這對于開發者來說無疑是一個好消息。
然而,值得注意的是,盡管DeepSeek的新模型已經發布并升級,但用戶們翹首以盼的DeepSeek R2版本卻仍未確定具體發布時間。這一消息可能會讓一些期待已久的用戶感到些許失望,但同時也增加了他們對未來版本的期待。
隨著人工智能技術的不斷發展,DeepSeek的新模型V3.1-Base無疑將為自然語言處理領域帶來新的突破和可能性。我們期待看到更多基于這一模型的創新應用和技術進步。