昆侖萬(wàn)維近日震撼宣布,其傾力打造的Matrix-Game大模型(規(guī)模超過(guò)170億參數(shù))已正式向公眾開(kāi)放源代碼。這一大模型,作為Matrix-Zero世界模型的重要組成部分,專注于可交互視頻生成領(lǐng)域。
據(jù)昆侖萬(wàn)維介紹,Matrix-Game標(biāo)志著Matrix系列在交互式世界生成領(lǐng)域的重大突破,同時(shí)也是業(yè)界首個(gè)對(duì)外公開(kāi)的、參數(shù)規(guī)模超過(guò)100億的空間智能大模型。該模型專為游戲世界的建模設(shè)計(jì),致力于在開(kāi)放環(huán)境中實(shí)現(xiàn)高質(zhì)量?jī)?nèi)容的生成與精準(zhǔn)控制。
Matrix-Game的核心競(jìng)爭(zhēng)力體現(xiàn)在三大方面:首先是Matrix-Game-MC數(shù)據(jù)集,這是一個(gè)由昆侖萬(wàn)維自主構(gòu)建的大規(guī)模交互世界數(shù)據(jù)集。該數(shù)據(jù)集不僅包含了海量的無(wú)標(biāo)簽Minecraft游戲視頻,還涵蓋了帶有精細(xì)動(dòng)作注釋的Minecraft與Unreal可控視頻數(shù)據(jù),這些數(shù)據(jù)為復(fù)雜環(huán)境動(dòng)態(tài)與交互模式的高效建模與學(xué)習(xí)提供了有力支撐。
其次是Matrix-Game主模型,這一模型基于先進(jìn)的擴(kuò)散模型技術(shù)開(kāi)發(fā),能夠根據(jù)用戶的輸入(如鍵盤指令、鼠標(biāo)移動(dòng)等)生成連貫且可控的互動(dòng)視頻。這些視頻在視覺(jué)質(zhì)量、時(shí)序一致性與物理合理性方面均表現(xiàn)出色,為用戶帶來(lái)了沉浸式的交互體驗(yàn)。
最后是GameWorld Score評(píng)測(cè)體系,昆侖萬(wàn)維提出了這一統(tǒng)一的游戲交互世界評(píng)估標(biāo)準(zhǔn),從視覺(jué)質(zhì)量、時(shí)序質(zhì)量、動(dòng)作可控性與物理規(guī)則理解四個(gè)維度對(duì)模型性能進(jìn)行全面量化。這一評(píng)測(cè)體系的建立,填補(bǔ)了該領(lǐng)域缺乏系統(tǒng)性評(píng)測(cè)基準(zhǔn)的空白。
在實(shí)際應(yīng)用中,Matrix-Game展現(xiàn)出了強(qiáng)大的場(chǎng)景適應(yīng)能力。它能夠在Minecraft的各種場(chǎng)景中(如森林、沙灘、沙漠等)實(shí)現(xiàn)可控生成,支持角色的基礎(chǔ)運(yùn)動(dòng)、復(fù)合運(yùn)動(dòng)以及視角變換等動(dòng)態(tài)行為。例如,在沙漠場(chǎng)景中,用戶只需通過(guò)鍵盤和鼠標(biāo)輸入控制指令,Matrix-Game就能生成對(duì)應(yīng)的游戲世界視頻,呈現(xiàn)出角色前后左右移動(dòng)、跳躍、攻擊等精彩瞬間。
Matrix-Game還支持自回歸式的長(zhǎng)視頻生成,這在時(shí)間一致性與環(huán)境適應(yīng)性方面均表現(xiàn)出卓越的性能。這一特性為開(kāi)發(fā)沉浸式長(zhǎng)時(shí)體驗(yàn)、創(chuàng)意內(nèi)容生成以及游戲設(shè)計(jì)等領(lǐng)域提供了堅(jiān)實(shí)的模型基礎(chǔ),預(yù)示著未來(lái)在交互式娛樂(lè)內(nèi)容創(chuàng)作方面的無(wú)限可能。