在2025年世界人工智能大會(WAIC)的盛大舞臺上,商湯大裝置攜手上海人工智能實(shí)驗(yàn)室(上海AI實(shí)驗(yàn)室),共同揭曉了一項(xiàng)旨在重塑AI算力格局的創(chuàng)新方案——基于DeepLink的異構(gòu)混合調(diào)度系統(tǒng)。這一突破性進(jìn)展標(biāo)志著商湯大裝置的核心能力體系迎來了深度進(jìn)化,將國產(chǎn)AI算力推向了一個(gè)全新的高度。
活動期間,商湯大裝置事業(yè)群的產(chǎn)品領(lǐng)航者盧國強(qiáng)與上海AI實(shí)驗(yàn)室的DeepLink解決方案專家王峰,在WAIC UP魔盒直播間進(jìn)行了精彩的解讀,深入剖析了該方案的技術(shù)內(nèi)核與行業(yè)價(jià)值。他們指出,面對國產(chǎn)算力資源分散、異構(gòu)芯片調(diào)度繁瑣、跨域訓(xùn)練穩(wěn)定性欠缺等現(xiàn)狀,DeepLink異構(gòu)混合調(diào)度系統(tǒng)猶如一把鑰匙,打開了高效協(xié)同與穩(wěn)定運(yùn)行的大門。
DeepLink,作為上海AI實(shí)驗(yàn)室傾力打造的人工智能開放計(jì)算體系,其核心使命在于搭建硬件芯片與深度學(xué)習(xí)軟件框架之間的無縫橋梁,促進(jìn)軟硬件生態(tài)的深度融合與開放共享。通過DeepLink,AI芯片與基礎(chǔ)框架得以緊密聯(lián)結(jié),上下游廠商僅需一次適配,便能輕松接入廣闊的算法海洋,實(shí)現(xiàn)軟硬件的靈活解綁,打破了傳統(tǒng)生態(tài)的界限。
針對當(dāng)前大規(guī)模集群建設(shè)中存在的軟硬件適配不足、資源利用率低下、供需失衡等痛點(diǎn),上海AI實(shí)驗(yàn)室率先邁出了探索的步伐,研發(fā)出DeepLink超大規(guī)模跨域混訓(xùn)技術(shù)方案。該方案憑借訓(xùn)練加速、異構(gòu)通信、并行策略等核心技術(shù)創(chuàng)新,成功跨越了芯片架構(gòu)的鴻溝,重構(gòu)了計(jì)算資源的調(diào)度體系,為智算中心的互聯(lián)與超大模型混訓(xùn)提供了堅(jiān)實(shí)的技術(shù)支撐。今年早些時(shí)候,上海AI實(shí)驗(yàn)室已攜手包括商湯在內(nèi)的多家伙伴,在上海成功構(gòu)建了超大規(guī)模跨域混訓(xùn)集群原型,并在自研的千億參數(shù)模型上,實(shí)現(xiàn)了長達(dá)20天的穩(wěn)定訓(xùn)練,效率直逼單一芯片集群的巔峰水平。
此次發(fā)布的基于DeepLink的異構(gòu)混合調(diào)度方案,是商湯大裝置與上海AI實(shí)驗(yàn)室深度合作的重要里程碑。該方案的深度融合,展現(xiàn)了以下幾大亮點(diǎn):它能夠?qū)崿F(xiàn)多種國產(chǎn)芯片間的無縫協(xié)同與統(tǒng)一調(diào)度,通過智能優(yōu)化并行策略與負(fù)載均衡,真正做到了“芯片各異,平臺一統(tǒng)”的高效協(xié)同;它顯著提升了異構(gòu)調(diào)度與彈性算力的靈活性,以秒級伸縮、分鐘級故障恢復(fù)的能力,確保了大模型訓(xùn)練過程的平穩(wěn)、高效與可控;同時(shí),它還全面兼容DeepSeek、InternLM、LLaMA、Qwen等主流大模型,適配稠密模型與MoE架構(gòu),為訓(xùn)練與推理的高效執(zhí)行提供了強(qiáng)有力的支持。
盧國強(qiáng)在解讀中強(qiáng)調(diào),借助DeepLink異構(gòu)混合調(diào)度方案,商湯大裝置將進(jìn)一步拓寬GPU適配范圍,加速訓(xùn)練與推理場景的拓展與商業(yè)化落地。未來,商湯大裝置與上海AI實(shí)驗(yàn)室將持續(xù)深化合作,加速國產(chǎn)AI算力芯片的適配與優(yōu)化進(jìn)程,共同夯實(shí)國產(chǎn)AI生態(tài)的基石,為智能時(shí)代的產(chǎn)業(yè)升級注入澎湃的技術(shù)活力。