近期,華為在算力領(lǐng)域投下了一枚震撼彈——“算力核彈”。這一創(chuàng)新方案基于384顆昇騰芯片構(gòu)建,通過全互連拓撲架構(gòu),實現(xiàn)了芯片間的高效協(xié)同工作,提供了驚人的300 PFLOPs密集BF16算力,這一性能已接近英偉達GB200 NVL72系統(tǒng)的兩倍。
這一成就不僅展現(xiàn)了華為在算力技術(shù)上的深厚積累,更在一定程度上削弱了先進工藝對于高性能計算的重要性。在某種程度上,這也標志著美國對高端芯片實施封鎖策略的失效。
面對外部制裁的巨大壓力,華為技術(shù)團隊并未退縮,而是提出了一系列創(chuàng)新理念,如“用數(shù)學(xué)補物理”、“非摩爾定律補摩爾定律”以及“用系統(tǒng)補單點”等。這些理念的核心在于,基于當(dāng)前可獲取的芯片制造工藝,通過計算、存儲和網(wǎng)絡(luò)技術(shù)的協(xié)同創(chuàng)新,打造全新的計算架構(gòu),并以此為基礎(chǔ),構(gòu)建了“超節(jié)點+集群”的系統(tǒng)算力解決方案。這一方案旨在長期滿足不斷增長的算力需求。
回顧2022年下半年,華為在風(fēng)雨飄搖中啟動了超節(jié)點的研發(fā)項目,該項目橫跨海思、計算和云等多個業(yè)務(wù)團隊。據(jù)項目組專家回憶,當(dāng)時64卡的方案已經(jīng)能夠滿足基本需求,但華為著眼未來,決心以昇騰AI云服務(wù)的形式向行業(yè)提供算力支持。為了實現(xiàn)這一目標,華為決定將超節(jié)點的規(guī)模提升至384卡,以確保在算力需求變化時能夠靈活應(yīng)對。
華為的這一壯舉也引起了業(yè)界的廣泛關(guān)注。英偉達CEO黃仁勛公開承認,華為在算力技術(shù)上已經(jīng)超越了英偉達。他指出,從技術(shù)參數(shù)上看,華為的CloudMatrix 384超節(jié)點在性能上甚至超越了英偉達,顯示出更強大的技術(shù)優(yōu)勢。因此,英偉達必須高度重視華為這一強勁對手,并全力以赴應(yīng)對挑戰(zhàn)。
在研發(fā)過程中,華為云團隊也遇到了不少挑戰(zhàn)。據(jù)內(nèi)部人士透露,早期的光模塊存在嚴重問題,無法直接用于“非摩爾定律”的解決方案中。為了解決這一問題,華為云團隊只能對每個光模塊的端面進行拍照,并逐個進行分析。經(jīng)過無數(shù)次的嘗試和改進,最終實現(xiàn)了較好的穩(wěn)定性。
功夫不負有心人,經(jīng)過華為團隊的不懈努力,昇騰CloudMatrix 384超節(jié)點終于橫空出世。這一創(chuàng)新方案不僅為華為贏得了業(yè)界的廣泛贊譽,更為國內(nèi)產(chǎn)業(yè)界提供了除傳統(tǒng)方案外的又一重要選擇。
隨著昇騰CloudMatrix 384超節(jié)點的成功推出,華為在算力領(lǐng)域的領(lǐng)先地位進一步得到鞏固。同時,這一創(chuàng)新方案也為國內(nèi)其他企業(yè)在算力技術(shù)上的突破提供了寶貴的經(jīng)驗和啟示。
華為的這一成就不僅彰顯了其在技術(shù)創(chuàng)新上的強大實力,更為國內(nèi)產(chǎn)業(yè)界在算力領(lǐng)域的發(fā)展注入了新的活力和動力。
未來,隨著算力需求的不斷增長,華為將繼續(xù)在算力技術(shù)上深耕細作,為行業(yè)提供更多優(yōu)質(zhì)的解決方案和服務(wù)。