国产98在线 | 传媒麻豆,久久―日本道色综合久久,久久久精品久久久久久久久久久,国产成人精品免费久久久久,五月综合色婷婷影院在线观看,久久久亚洲精品视频

  • 虎科技 - 領先的互聯網科技媒體

字節開源MoE關鍵優化技術,主流大模型均能接入,訓練成本可省40%!

   時間:2025-03-10 19:01 來源:ITBEAR作者:快訊

3 月 10日,字節豆包大模型團隊官宣開源一項針對 MoE 架構的關鍵優化技術,可將大模型訓練效率提升1.7倍,成本節省40%。據悉,該技術已實際應用于字節的萬卡集群訓練,累計幫助節省了數百萬 GPU 小時訓練算力。

MoE 是當前大模型的主流架構,但其在分布式訓練中存在大量跨設備通信開銷,嚴重制約了大模型訓練效率和成本。以海外主流模型Mixtral-8x7B為例, 其訓練過程中通信時間占比可高達 40%。針對這一難題,字節在內部研發了COMET計算-通信重疊技術,通過多項創新,大幅壓縮了MoE專家通信空轉時間。

相較DeepSeek近期開源的DualPipe等MoE優化方案,COMET可以像插件一樣直接接入已有的MoE訓練框架,支持業界絕大部分主流大模型,無需對訓練框架進行侵入式改動。因簡潔、通用的設計理念,該工作以5/5/5/4 的高分入選全球機器學習系統頂級會議 MLSys 2025 ,被認為“在大規模生產環境中極具應用潛力”。

具體而言, COMET 從系統層面建立了面向 MoE 的細粒度流水線編程方式,通過引入共享張量依賴解析、自適應負載分配兩項關鍵機制,來解決通信與計算之間的粒度錯配問題,并精準平衡通信與計算負載,最終大幅提升MoE流水線整體效率。 引入COMET后,單個 MoE 層上可實現 1.96 倍加速、端到端平均 1.71 倍效率提升,且在不同并行策略、輸入規模及硬件環境下均表現穩定。

截屏2025-03-10 16.30.30

COMET 的設計結構

COMET 與Deepseek 研發的DualPipe方案還可以聯合使用。在降低MoE通信開銷上,COMET 采用了計算-通信融合算子的優化方式, DualPipe則通過排布算子來掩蓋通信,兩種方案并不沖突,結合使用或將更大幅度壓縮模型訓練成本。

目前,COMET支持多種MoE并行模式,部署靈活、方便。同時,COMET核心代碼已開源,并向開發者提供了一套友好的 Python API,計劃兼容 Triton 等編譯生態。

COMET論文鏈接:https://arxiv.org/pdf/2502.19811

開源地址:https://github.com/bytedance/flux

 
 
更多>同類內容
推薦圖文
推薦內容
點擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數碼群

主站蜘蛛池模板: 国产在线观看不卡 | 在线视频国产网址你懂的在线视频 | 五月婷婷丁香网 | 欧美高清在线视频在线99精品 | 午夜视频精品 | 羞羞的视频在线 | 欧美高清一区 | 不卡久久 | 中文免费视频 | 99在线免费视频 | 六月丁香婷婷综合 | 九九久久精品国产免费看小说 | 午夜在线电影 | 国产成人一区二区三区精品久久 | 欧美乱妇高清无乱码在线观看 | 99久久精品国产一区二区三区 | 国产在线资源站 | 久久久久亚洲视频 | 精品国产一区在线观看 | 四虎网站| 男人的天堂天堂网 | 手机在线国产视频 | 亚洲精品视频在线观看免费 | 婷婷丁香六月天 | 羞羞视频在线看免费 | 免费国产最新进精品视频 | 亚洲国产精品67194成人 | 交免费观看在线 | 亚洲精品www久久久久久 | 亚洲视频在线免费观看 | 国产福利在线观看精品 | 欧美日韩国产在线播放 | 四虎影院最新地址 | 丁香综合五月 | 视频一区二区欧美日韩在线 | 中文字幕 亚洲精品 第1页 | 强波多野结衣cjod经典片 | 第四色网址 | 国产精品久久久久久久久久免费 | 亚洲综合九九 | 亚洲第一页国产 |