国产98在线 | 传媒麻豆,久久―日本道色综合久久,久久久精品久久久久久久久久久,国产成人精品免费久久久久,五月综合色婷婷影院在线观看,久久久亚洲精品视频

  • 虎科技 - 領(lǐng)先的互聯(lián)網(wǎng)科技媒體

AI芯片爭(zhēng)霸戰(zhàn):英偉達(dá)霸主地位還能穩(wěn)多久?

   時(shí)間:2025-04-30 21:33 來源:ITBEAR作者:趙云飛

在人工智能大模型浪潮的推動(dòng)下,英偉達(dá)的數(shù)據(jù)中心GPU出貨量在2023年實(shí)現(xiàn)了顯著增長(zhǎng),總計(jì)達(dá)到了約376萬臺(tái),相較于前一年的264萬臺(tái),增幅超過百萬臺(tái)。這一增長(zhǎng)使英偉達(dá)成為歷史上硬件公司中規(guī)模增長(zhǎng)最快的之一。據(jù)行業(yè)預(yù)測(cè),到2025年,英偉達(dá)的GPU銷量有望達(dá)到650萬至700萬塊。

盡管英偉達(dá)在GPU市場(chǎng)上的壟斷地位依舊穩(wěn)固,但圍繞其長(zhǎng)期持久性(超過6年)的討論卻從未停歇。面對(duì)這一形勢(shì),谷歌、微軟、亞馬遜和meta等海外科技巨頭正積極整合AI需求,力圖成為NPU的主要消費(fèi)者,并紛紛自研具備競(jìng)爭(zhēng)力且高度可靠的芯片。

與此同時(shí),計(jì)算需求的急劇增加已經(jīng)觸及了資本支出、電力供應(yīng)和基礎(chǔ)設(shè)施建設(shè)的極限。這一現(xiàn)狀正促使行業(yè)轉(zhuǎn)向分布式、垂直集成和協(xié)同優(yōu)化的系統(tǒng),包括芯片、機(jī)架、網(wǎng)絡(luò)、冷卻、基礎(chǔ)設(shè)施軟件及電源等方面。然而,英偉達(dá)在這一轉(zhuǎn)型過程中顯得準(zhǔn)備不足。

據(jù)英偉達(dá)透露,在2025財(cái)年第四季度,公司交付了價(jià)值110億美元的Blackwell芯片,這些芯片主要銷售給云巨頭,占據(jù)了英偉達(dá)數(shù)據(jù)中心業(yè)務(wù)收入的相當(dāng)一部分。然而,業(yè)內(nèi)分析認(rèn)為,云巨頭在英偉達(dá)的市場(chǎng)份額可能會(huì)縮減,同時(shí),小型或短期GPU租賃廠商的利用率和投資回報(bào)率也普遍較低。

隨著前沿模型的成本降低、性能和泛化能力提升,尤其是借助有效的RAG和廣泛可用的微調(diào)機(jī)制,許多使用特定數(shù)據(jù)訓(xùn)練專有模型的公司面臨價(jià)值點(diǎn)不明確的問題,這些長(zhǎng)尾買家的需求也變得不穩(wěn)定。與此同時(shí),一些小型獨(dú)立云廠商的未來前景也不明朗,盡管英偉達(dá)曾給予他們資金和GPU支持,但這些廠商在產(chǎn)品多樣性、基礎(chǔ)設(shè)施和人才方面仍然匱乏。

相比之下,云巨頭的需求卻迅速增長(zhǎng)。外部開發(fā)者面臨長(zhǎng)期資源短缺,交付周期長(zhǎng)達(dá)數(shù)月,而內(nèi)部需求也加劇了這一趨勢(shì)。云巨頭憑借其規(guī)模和基礎(chǔ)設(shè)施經(jīng)驗(yàn),在攤銷折舊和停機(jī)成本方面具有優(yōu)勢(shì),同時(shí)提供高靈活性、安全性和可靠性,從而獲得了高AI服務(wù)利潤(rùn)率和客戶信任度。

谷歌就是一個(gè)典型的例子。自2013年以來,谷歌一直在內(nèi)部開發(fā)TPU。盡管開發(fā)周期長(zhǎng)達(dá)數(shù)年,但在預(yù)算、人才和架構(gòu)有限的情況下,TPU v1從啟動(dòng)到部署僅用了15個(gè)月。并且,歷屆TPU在性能和能耗上相較于GPU都展現(xiàn)出優(yōu)勢(shì)。如今,TPU已經(jīng)發(fā)展到第六代Trillium,能效和HBM容量提高了一倍,峰值性能提高了三倍以上。而谷歌也在迭代其軟件堆棧,由TensorFlow過渡到JAX,用于處理編譯和低級(jí)部署優(yōu)化。TPU和JAX的組合幾乎完全取代了谷歌內(nèi)部用于AI工作負(fù)載的英偉達(dá)GPU。

本月初,谷歌發(fā)布了第七代TPU“Ironwood”,作為谷歌首款面向AI推理時(shí)代的TPU,單芯片峰值算力可達(dá)4614 TFLOPs。Ironwood可擴(kuò)展至9216片芯片集群,性能是第六代TPU Trillium的兩倍,并且能效較之于第一款Cloud TPU高出近30倍。HBM帶寬也有所提升,單顆Ironwood芯片的內(nèi)存帶寬達(dá)7.2Tbps,是Trillium的4.5倍。

除了谷歌,亞馬遜也在加速芯片開發(fā)。自2015年收購(gòu)Annapurna Labs后,亞馬遜推出了第二代Inferentia和新的Trainium芯片。預(yù)計(jì)到2026年,相關(guān)支出將達(dá)到25億美元。微軟則推出了自研AI芯片Maia 100芯片和相關(guān)的Cobalt 100 CPU,并推出了兼容Pytorch的編譯器Maia SDK,依靠OpenAI的Triton框架來取代CUDA。

meta同樣在布局ASIC。早期,meta芯片主要為Instagram和Reels提供DLRM。隨著第二代MTIA芯片發(fā)布和支持定制軟件堆棧,meta已開始在Facebook和Instagram的新聞推送推薦系統(tǒng)中使用推理芯片。meta還在合成數(shù)據(jù)生成方面擴(kuò)大芯片使用,并據(jù)外媒報(bào)道,已經(jīng)在小規(guī)模部署測(cè)試其首款用于AI訓(xùn)練的自研芯片。

當(dāng)前,AI的工作負(fù)載偏向于訓(xùn)練。即使在微軟,訓(xùn)練也約占算力需求的六成。然而,隨著重心由訓(xùn)練轉(zhuǎn)向推理,英偉達(dá)面臨的壓力也在增大。業(yè)內(nèi)分析認(rèn)為,在許多情況下,尤其是對(duì)于中型模型,上一代A100的性價(jià)比都高于H100。而AMD也正在成為更具競(jìng)爭(zhēng)力的替代品。甚至從長(zhǎng)遠(yuǎn)來看,尤其是對(duì)于小模型而言,基于CPU的推理或?yàn)樽罴堰x擇。

分布式系統(tǒng)帶來的挑戰(zhàn)同樣不容忽視。盡管英偉達(dá)B100的單芯片性能相當(dāng)于3個(gè)Trillium TPU,但有觀點(diǎn)認(rèn)為,單芯片性能并不重要。云巨頭能夠垂直整合并利用其規(guī)模和專業(yè)打造總體上更經(jīng)濟(jì)、性能更高的分布式系統(tǒng)。這對(duì)于英偉達(dá)而言,將是一個(gè)難以競(jìng)爭(zhēng)或適應(yīng)的結(jié)構(gòu)性趨勢(shì)。

微軟的數(shù)據(jù)中心設(shè)計(jì)就是一個(gè)例證。他們規(guī)劃了自己的電信光纖網(wǎng)絡(luò),并推出新的ColorZ可插拔光收發(fā)器+DSP,以支持長(zhǎng)距離數(shù)據(jù)傳輸,通過連接數(shù)據(jù)中心有效提高峰值集群性能。而谷歌則放棄了大型芯片,轉(zhuǎn)而采用體積更小、成本更低、且具有深度互連的ASIC集群。這些努力都顯著提高了系統(tǒng)的整體性能和效率。

基礎(chǔ)設(shè)施正在變得愈發(fā)分布式。以meta為例,Llama 3的訓(xùn)練并非集中于單一數(shù)據(jù)中心。由于需要在包括AWS、Oracle等云上進(jìn)行訓(xùn)練,meta正在通過與HammerSpace合作將多云多數(shù)據(jù)中心的數(shù)據(jù)完全統(tǒng)一起來。微軟也正在為OpenAI連接遍布全國(guó)的集群。海外巨頭都在積極探索實(shí)現(xiàn)真正的異步分布式訓(xùn)練。

分布式基礎(chǔ)設(shè)施是繼續(xù)擴(kuò)展和計(jì)算新OOM的唯一途徑。目前,算力仍舊是前沿模型發(fā)展的最大制約因素。而多數(shù)據(jù)中心訓(xùn)練允許使用規(guī)模較小、互聯(lián)互通的數(shù)據(jù)中心,這不僅降低了成本,而且提高了吞吐量。同時(shí),也加速了基礎(chǔ)設(shè)施的建設(shè)。

然而,盡管分布式系統(tǒng)為非傳統(tǒng)但資金雄厚的參與者創(chuàng)造了一些機(jī)會(huì),但基礎(chǔ)設(shè)施專業(yè)知識(shí)至關(guān)重要。巨頭必須不斷擴(kuò)展以訓(xùn)練出更優(yōu)秀的模型。長(zhǎng)期來看,關(guān)鍵區(qū)別在于訓(xùn)練將在x00MW-xGW數(shù)據(jù)中心的“小型”聯(lián)網(wǎng)園區(qū)中進(jìn)行,而不是在xxGW級(jí)的單體數(shù)據(jù)中心中進(jìn)行。

基于前述趨勢(shì),業(yè)內(nèi)分析認(rèn)為,英偉達(dá)將很難在性能或成本上競(jìng)爭(zhēng)。其既無法與云深度集成,也無法定制硬件。除非發(fā)展出規(guī)模較小的客戶,否則英偉達(dá)本身并不適合服務(wù)于跨集群或百億億次級(jí)的情況。英偉達(dá)面臨著前所未有的長(zhǎng)期挑戰(zhàn)。

 
 
更多>同類內(nèi)容
推薦圖文
推薦內(nèi)容
點(diǎn)擊排行
 
智快科技微信賬號(hào)
ITBear微信賬號(hào)

微信掃一掃
加微信拉群
電動(dòng)汽車群
科技數(shù)碼群

主站蜘蛛池模板: 亚洲自拍激情 | 国产精品v欧美精品v日本精 | 五月丁五月丁开行停停乱 | 成人99国产精品一级毛片 | 一级毛片免费在线观看网站 | 亚洲精品乱码久久久久久 | 亚洲福利小视频 | 国产精品情人露脸在线观看 | 丁香综合网 | 久久精品亚洲精品国产欧美 | 自拍偷拍亚洲视频 | 日韩精品久久久毛片一区二区 | 丁香伊人五月综合激激激 | 日韩欧美视频免费观看 | 亚洲第一在线视频 | 国产精品成人一区二区不卡 | 久久国产精品久久国产片 | 欧美四虎精品二区免费 | 中文乱码一二三四有限公司 | 亚洲一区二区三区福利在线 | 亚洲欧美不卡视频 | 亚洲最大视频网站 | 成人精品一区二区三区 | 波多野结在线 | 日本a级片在线观看 | 伊人亚洲影院 | 国产日韩欧美综合 | 久久久久成人精品一区二区 | 男人的天堂网在线 | 羞羞视频免费网站在线看 | 亚洲午夜小视频 | 在线播放 亚洲 | 羞羞视频免费入口网站 | 美日韩免费视频 | 亚洲精品中文字幕乱码三区一二 | 国产亚洲精品美女 | 最新久久免费视频 | 日韩成人免费在线 | 激情综合网婷婷 | 欧洲亚洲综合一区二区三区 | 欧美人日b |