近期,業界傳出消息,中國眾多企業紛紛婉拒了NVIDIA的H20芯片,這一舉動促使NVIDIA創始人黃仁勛親自前往臺積電進行磋商。市場普遍猜測,此行目的或是要求臺積電調整生產計劃,停產H20,轉而專注于制造一款針對中國市場定制的新型AI芯片,以期在與國內AI芯片制造商的競爭中占據優勢。
據內部消息透露,這款定制芯片被業界非正式命名為B30A,其基于NVIDIA的B300系列進行深度定制。盡管預估其性能僅為B300的幾分之一,但即便如此,其性能依舊遠超當前市場上的國產AI芯片。這一消息無疑給正在奮力追趕全球AI技術前沿的國內企業帶來了巨大的挑戰。
回顧NVIDIA的發展歷程,其高端芯片如H100和A100,以及后續的B200和B300,每一次升級都帶來了顯著的性能提升。例如,B300的推理性能是H100的30倍,而H100的性能又是A100的六倍。據此推算,即便B30A的性能僅為B300的十分之一,其性能也將是A100的18倍,這無疑將對國內AI芯片市場產生深遠影響。
對于國內AI企業來說,選擇繼續使用NVIDIA的芯片,將能夠有效避免兼容性問題。由于全球大多數大模型都是基于NVIDIA的CUDA生態構建的,因此繼續使用NVIDIA的芯片將有助于國內企業更好地融入這一生態,從而加速其技術進步和市場拓展。
CUDA生態的強大之處,在于其歷經十多年的發展,已經形成了深厚的技術積累和廣泛的應用基礎。當年NVIDIA力排眾議,獨自推動CUDA生態的發展,為全球程序員提供了極大的便利。如今,這一生態已經成為NVIDIA在AI芯片市場中的核心競爭力之一。AMD和Intel等競爭對手在試圖進入AI芯片市場時,都曾因CUDA生態的壁壘而受阻。
采用NVIDIA的新款B30A芯片還將有助于降低國內AI企業的能耗。隨著AI技術的快速發展,大模型的構建和運行所需的AI芯片數量急劇增加,能耗問題日益凸顯。而B30A芯片將采用臺積電4納米工藝生產,這將大幅度降低其功耗,從而減輕企業的能耗負擔。