国产98在线 | 传媒麻豆,久久―日本道色综合久久,久久久精品久久久久久久久久久,国产成人精品免费久久久久,五月综合色婷婷影院在线观看,久久久亚洲精品视频

  • 虎科技 - 領先的互聯(lián)網(wǎng)科技媒體

微軟發(fā)布BitNet b1.58 2B4T,以低精度架構實現(xiàn)高效大型語言模型

   時間:2025-04-18 10:08 來源:ITBEAR作者:楊凌霄

近日,科技界迎來了一項令人矚目的創(chuàng)新成果——微軟研究團隊推出的開源大型語言模型BitNet b1.58 2B4T。這款模型以獨特的低精度架構原生訓練而成,擁有20億參數(shù),卻在計算資源需求上實現(xiàn)了大幅縮減。

據(jù)技術報告顯示,BitNet b1.58 2B4T的性能直逼同規(guī)模的全精度模型。其非嵌入內(nèi)存占用僅為0.4GB,這一數(shù)據(jù)遠低于競品Gemma-3 1B的1.4GB和MiniCPM 2B的4.8GB,展現(xiàn)了其卓越的內(nèi)存效率。

BitNet的高效秘訣在于其創(chuàng)新的架構。該模型摒棄了傳統(tǒng)的16位數(shù)值,采用定制的BitLinear層,將權重限制為-1、0、+1三種狀態(tài),形成了三值系統(tǒng)。這種設計使得每權重僅需約1.58位信息存儲,從而實現(xiàn)了高效的存儲和計算。

BitNet在層間激活值上也進行了優(yōu)化,采用了8位整數(shù)量化,形成了W1.58A8的配置。同時,微軟還對Transformer架構進行了調整,引入了平方ReLU激活函數(shù)、標準旋轉位置嵌入(RoPE)以及subln歸一化等技術,確保了低位訓練的穩(wěn)定性。這種原生1位訓練的方式避免了傳統(tǒng)后訓練量化(PTQ)可能帶來的性能損失。

BitNet b1.58 2B4T的開發(fā)歷經(jīng)了三個階段。首先,基于4萬億token的網(wǎng)絡數(shù)據(jù)、代碼和合成數(shù)學數(shù)據(jù)集進行了預訓練。隨后,通過公開及合成指令數(shù)據(jù)集進行了監(jiān)督微調(SFT),如WizardLM Evol-Instruct等。最后,采用直接偏好優(yōu)化(DPO)方法,利用UltraFeedback等數(shù)據(jù)集提升了模型的對話能力和安全性。

微軟的測試結果顯示,BitNet在GSM8K(數(shù)學)、PIQA(物理常識)等基準測試中表現(xiàn)優(yōu)異,整體性能與主流1B-2B參數(shù)的全精度模型相當。同時,在能耗和CPU解碼延遲上也占據(jù)了顯著優(yōu)勢,每token能耗僅為0.028焦耳,CPU解碼延遲為29毫秒。

然而,值得注意的是,BitNet的高效性需要依賴微軟提供的專用C++框架bitnet.cpp來實現(xiàn)。如果使用標準工具如Hugging Face transformers庫,則無法充分展現(xiàn)其速度和能耗優(yōu)勢。

微軟還透露了未來的計劃,包括優(yōu)化GPU和NPU支持,延長上下文窗口至4096 token,并探索更大規(guī)模的模型、多語言功能以及硬件協(xié)同設計。目前,BitNet b1.58 2B4T已經(jīng)以MIT許可證在Hugging Face上發(fā)布,供社區(qū)進行測試和應用。

 
 
更多>同類內(nèi)容
推薦圖文
推薦內(nèi)容
點擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數(shù)碼群

主站蜘蛛池模板: 国产日韩欧美一区二区 | 自拍亚洲国产 | 日本精品久久久一区二区三区 | 男人的天堂aa | 亚洲成人精品久久 | 免费自拍偷拍 | 黄色污污在线观看 | 俄罗斯三级完整版在线观看 | 亚洲免费毛片 | 九月婷婷丁香 | 男女做羞羞的网站视频 | 久久91精品久久久久久水蜜桃 | 羞羞视频入口网站 | 国产视频 每日更新 | 久久久久成人精品一区二区 | 波多野结衣视频免费 | 五月天丁香婷婷综合久久 | 日韩欧美视频 | 欧美视频在线一区 | 久久久国产精品免费视频 | 亚洲午夜视频 | 亚洲 自拍 露出 极品 | 成人四虎 | 亚洲综合成人网在线观看 | 一色一情一欲一乱 | 华人色| 亚洲高清免费观看 | 国产精品免费小视频 | 中文字幕精品在线观看 | 久久久999国产精品 久久精品免费观看 | 男人的天堂在线观看 | 在线免费观看视频黄 | 免费自拍偷拍 | 亚洲日韩在线视频 | 色播视频在线观看免费 | 亚洲成av人影片在线观看 | 久久精品视频一区二区三区 | 久久小视频| 一级国产仑乱 | 欧美日本综合一区二区三区 | 七月丁香色婷婷综合激情 |