近期,華為在算力領域投下了一枚震撼彈——“算力核彈”。這一創新方案基于384顆昇騰芯片構建,通過全互連拓撲架構,實現了芯片間的高效協同工作,提供了驚人的300 PFLOPs密集BF16算力,這一性能已接近英偉達GB200 NVL72系統的兩倍。
這一成就不僅展現了華為在算力技術上的深厚積累,更在一定程度上削弱了先進工藝對于高性能計算的重要性。在某種程度上,這也標志著美國對高端芯片實施封鎖策略的失效。
面對外部制裁的巨大壓力,華為技術團隊并未退縮,而是提出了一系列創新理念,如“用數學補物理”、“非摩爾定律補摩爾定律”以及“用系統補單點”等。這些理念的核心在于,基于當前可獲取的芯片制造工藝,通過計算、存儲和網絡技術的協同創新,打造全新的計算架構,并以此為基礎,構建了“超節點+集群”的系統算力解決方案。這一方案旨在長期滿足不斷增長的算力需求。
回顧2022年下半年,華為在風雨飄搖中啟動了超節點的研發項目,該項目橫跨海思、計算和云等多個業務團隊。據項目組專家回憶,當時64卡的方案已經能夠滿足基本需求,但華為著眼未來,決心以昇騰AI云服務的形式向行業提供算力支持。為了實現這一目標,華為決定將超節點的規模提升至384卡,以確保在算力需求變化時能夠靈活應對。
華為的這一壯舉也引起了業界的廣泛關注。英偉達CEO黃仁勛公開承認,華為在算力技術上已經超越了英偉達。他指出,從技術參數上看,華為的CloudMatrix 384超節點在性能上甚至超越了英偉達,顯示出更強大的技術優勢。因此,英偉達必須高度重視華為這一強勁對手,并全力以赴應對挑戰。
在研發過程中,華為云團隊也遇到了不少挑戰。據內部人士透露,早期的光模塊存在嚴重問題,無法直接用于“非摩爾定律”的解決方案中。為了解決這一問題,華為云團隊只能對每個光模塊的端面進行拍照,并逐個進行分析。經過無數次的嘗試和改進,最終實現了較好的穩定性。
功夫不負有心人,經過華為團隊的不懈努力,昇騰CloudMatrix 384超節點終于橫空出世。這一創新方案不僅為華為贏得了業界的廣泛贊譽,更為國內產業界提供了除傳統方案外的又一重要選擇。
隨著昇騰CloudMatrix 384超節點的成功推出,華為在算力領域的領先地位進一步得到鞏固。同時,這一創新方案也為國內其他企業在算力技術上的突破提供了寶貴的經驗和啟示。
華為的這一成就不僅彰顯了其在技術創新上的強大實力,更為國內產業界在算力領域的發展注入了新的活力和動力。
未來,隨著算力需求的不斷增長,華為將繼續在算力技術上深耕細作,為行業提供更多優質的解決方案和服務。