在WAIC 2025大模型論壇的舞臺(tái)上,商湯科技帶來(lái)了一場(chǎng)技術(shù)盛宴,正式揭曉了其精心打造的「悟能」具身智能平臺(tái)。該平臺(tái)以商湯的具身世界模型為心臟,借助商湯大裝置的強(qiáng)大算力,為機(jī)器人及智能設(shè)備賦予了前所未有的感知力、視覺(jué)導(dǎo)航技能以及多模態(tài)交互能力,引領(lǐng)智能終端邁向更高階的自主與智能境界。
「悟能」平臺(tái)不僅能夠讓機(jī)器人等硬件具備對(duì)周遭世界的深刻理解,還能輕松嵌入端側(cè)芯片,展現(xiàn)出極強(qiáng)的環(huán)境適應(yīng)性。在演示環(huán)節(jié),商湯科技的首席執(zhí)行官徐立親自上陣,展示了搭載具身世界引擎的人形機(jī)器人。這臺(tái)機(jī)器人不僅能夠流暢地展示PPT,如“長(zhǎng)安的荔枝”般引人入勝,還能自如地翻頁(yè)、回答觀眾提問(wèn),并適時(shí)做出總結(jié),語(yǔ)言風(fēng)趣,動(dòng)作自然,贏得了現(xiàn)場(chǎng)陣陣掌聲。
商湯的具身世界模型更進(jìn)一步,能夠創(chuàng)造出多視角視頻,確保視頻內(nèi)容在時(shí)間與空間上的高度一致,使機(jī)器不僅能理解、生成,還能編輯真實(shí)世界。這一突破意味著,用戶或許能在真實(shí)的街道環(huán)境中體驗(yàn)“極品飛車(chē)”般的虛擬冒險(xiǎn),實(shí)現(xiàn)空間層面的世界交互。
該模型還能構(gòu)建出包含人、物、場(chǎng)景的4D真實(shí)世界。用戶只需輸入簡(jiǎn)單的指令,如“在廚房架子上找東西”或“進(jìn)入娛樂(lè)室,右轉(zhuǎn),打開(kāi)通往院子的門(mén)”,具身世界模型便能自動(dòng)生成相應(yīng)的位置、動(dòng)作骨架及執(zhí)行指令,展現(xiàn)了其強(qiáng)大的實(shí)用性與靈活性。
徐立在會(huì)上強(qiáng)調(diào),商湯科技的愿景是通過(guò)「悟能」具身智能平臺(tái),助力眾多具身智能企業(yè),實(shí)現(xiàn)他們與現(xiàn)實(shí)世界深度互動(dòng)的夢(mèng)想。這一平臺(tái)的推出,無(wú)疑為智能科技的發(fā)展注入了新的活力,開(kāi)啟了人機(jī)交互的新篇章。