在人工智能(AI)領域,訓練與推理兩大核心環節相輔相成,如同教育的“學習”與“考試”。訓練階段,如同學生汲取知識,需要龐大的數據集與強大的計算能力作為支撐;而推理階段,則類似于學生應用所學解答問題,強調快速、準確地應對實際應用場景的需求。隨著AI技術應用的日益廣泛,推理算力的需求顯著增長。據國際數據公司(IDC)數據顯示,2022年,云端推理算力占比已達到58.5%,并預計將在2026年進一步上升至62.2%。
近期,一家在AI芯片領域深耕11年的上市公司,宣布將重心轉向大模型推理算力的發展。7月25日,在2025年世界人工智能大會(WAIC)前夕,云天勵飛(股票代碼:688343.SH)正式發布了深穹Edge200芯片以及深穹X6000 Mesh推理計算卡等一系列新品。
深穹X6000 Mesh推理加速卡,以其高達256Tops的算力,專為AI推理計算設計,能夠支持30fps的1080p視頻解碼,滿足千億參數大模型的推理應用需求。基于這款加速卡,云天勵飛還推出了深目6203視頻高密2U推理一體機、天舟6408大模型4U推理一體機以及天舟680G大模型滿血版8U推理一體機,提供最高可達4PFlops的推理算力,助力AI模型的商業化落地。
云天勵飛董事長兼CEO陳寧表示,公司正全面聚焦于AI推理芯片領域。2025年是AI發展的關鍵轉折點,大模型技術不斷成熟,調用成本大幅降低。盡管當前AI推理芯片市場相較于訓練芯片市場仍顯小眾,但預計未來三至五年內,其增長速度將遠超訓練芯片。這標志著AI正從訓練時代邁入推理時代,推理算力的需求將迎來爆發式增長。
陳寧進一步指出,未來五年,AI將重塑機器人、AI眼鏡等終端硬件產品,推理算力網絡將無處不在。作為底層算力設施,AI推理芯片將貫穿端、邊、云,構建無處不在的算力網絡,使各類智能體能夠更好地服務于人類的工作與生活。
成立于2014年的云天勵飛,擁有大模型和AI芯片兩大技術平臺,業務覆蓋消費級、企業級和行業級三大場景。經過11年的發展,云天勵飛已推出五代神經網絡處理器(NPU),并形成了一系列產品矩陣。早在2020年,云天勵飛就全面轉向國產工藝,成為首家采用國產Chiplet工藝的AI芯片公司。
2023年,云天勵飛正式發布基于“算力積木”架構的DeepEdge10芯片平臺,包括DeepEdge10C、DeepEdge10標準版、DeepEdge10Max和DeepEdge200四款芯片,算力范圍覆蓋8T至256T,滿足從小型邊緣設備到智算中心高性能計算的需求。云天勵飛還推出了面向云、邊、端的AI推理產品系列,包括模組、邊緣智能盒子、AI推理加速卡、大模型推理一體機以及智算服務器等。
隨著AI熱潮的興起,云天勵飛的業績持續增長。財報顯示,2024年,公司營業收入超過9億元,同比增長81.3%。截至2025年第一季度,公司營收達到2.64億元,同比大幅增長168.23%,創歷史同期新高。在消費級業務方面,云天勵飛通過智能穿戴設備和AI硬件產品線,預計2025年上半年將保持50%以上的增速。
對于為何從邊緣AI計算戰略轉向AI模型推理算力,陳寧表示,對于中國而言,AI推理芯片是推動AI產業大規模落地的關鍵領域和關鍵技術。未來五年,大模型、算法和推理芯片為核心的AI技術將重新定義人類的電子產品;未來五到十年,以推理芯片為核心的AI算力網絡將無處不在。
云天勵飛深穹X6000 Mesh加速卡具有多項核心技術特點,包括采用自研第四代NPU,高效支持Transformer架構;Edge芯片采用國產工藝制造,并通過自主可控國產化C級認證;作為國內首顆量產的基于國產先進工藝的“算力積木”架構的AI芯片,它實現了片間算力擴展,滿足千億級大模型部署需求。
陳寧透露,目前基于深穹X6000 Mesh推理加速卡的推理一體機正在逐步量產落地。同時,云天勵飛在智算中心領域也有所布局,服務于城市級智算中心建設、科研院所、運營商以及互聯網大廠等客戶。
云天勵飛CTO李愛軍透露,下一代“算力積木”架構和AI推理芯片將有五個方面的重要升級,包括采用新型計算、近存計算、NB-Mesh新型互聯、新型封裝以及NB-Link通用擴展性等,以滿足嵌入式物聯網、邊緣端、云推理對邊緣大模型、MoE大模型的極致推理效率、能效比和性價比需求。基于第二代“算力積木”架構的云天勵飛下一代AI推理芯片預計將于2026年底陸續推出。
面對國產芯片發展的挑戰與機遇,陳寧表示,云天勵飛作為國產AI芯片公司,面臨著起步晚、生態不完善等挑戰,但團隊擁有基于矩陣類并行計算芯片的基因、決心和信念,可以克服各種挑戰。同時,云天勵飛持續擁抱國產工藝,擁有市場差異化競爭優勢。