騰訊在大模型戰(zhàn)略上的步伐正日益加快,為企業(yè)和個(gè)人智能化轉(zhuǎn)型鋪設(shè)道路。在騰訊云AI產(chǎn)業(yè)應(yīng)用峰會(huì)上,騰訊集團(tuán)高級(jí)執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生強(qiáng)調(diào):“AI正全面融入各行各業(yè),每個(gè)企業(yè)都在向AI公司轉(zhuǎn)變,而個(gè)人也將借助AI力量成為‘超級(jí)個(gè)體’。”
5月21日,騰訊混元系列大模型迎來(lái)了全面升級(jí),其中旗艦級(jí)快速思考模型混元TurboS與深度思考模型混元T1均發(fā)布了全新迭代版本。基于TurboS,騰訊推出了視覺(jué)深度推理模型T1-Vision與端到端語(yǔ)音通話模型混元Voice,進(jìn)一步豐富了其AI應(yīng)用生態(tài)。
湯道生透露,在全球權(quán)威的大語(yǔ)言模型評(píng)測(cè)平臺(tái)Chatbot Arena上,混元TurboS的排名已躍升至全球前八,僅次于國(guó)內(nèi)的DeepSeek。特別是在代碼與數(shù)學(xué)等理科能力方面,TurboS也躋身全球前十。這一成就得益于其預(yù)訓(xùn)練階段的tokens增訓(xùn)以及后訓(xùn)練階段的長(zhǎng)短思維鏈融合技術(shù),使得理科推理能力提升超過(guò)10%,代碼能力提升24%,競(jìng)賽數(shù)學(xué)成績(jī)更是大幅提升39%。
自年初上線元寶App以來(lái),深度思考模型混元T1持續(xù)迭代,近期在多項(xiàng)核心能力上均實(shí)現(xiàn)顯著提升。競(jìng)賽數(shù)學(xué)效果提升8%,常識(shí)問(wèn)答提升8%,復(fù)雜任務(wù)的Agent能力提升13%。這些進(jìn)步使得混元T1在多個(gè)應(yīng)用場(chǎng)景中展現(xiàn)出更強(qiáng)的競(jìng)爭(zhēng)力。
當(dāng)前,國(guó)內(nèi)大模型市場(chǎng)呈現(xiàn)多元化發(fā)展態(tài)勢(shì),各家大模型均擁有獨(dú)特的技術(shù)優(yōu)勢(shì)。騰訊混元的多模態(tài)模型,如3D和視頻生成功能,在開發(fā)者社區(qū)內(nèi)廣受好評(píng)。此次發(fā)布的視覺(jué)深度推理模型T1-Vision支持多圖輸入,具備原生思維鏈,能夠?qū)崿F(xiàn)“邊看圖邊思考”,整體效果提升5.3%,理解速度提升50%。
另一款新推出的語(yǔ)音模型混元Voice,則是一款端到端語(yǔ)音通話模型,能夠?qū)崿F(xiàn)低延遲語(yǔ)音通話,響應(yīng)速度提升超過(guò)30%,降至1.6秒。同時(shí),其擬人性和情緒應(yīng)用能力也有顯著提升,已在騰訊元寶App灰度上線,實(shí)時(shí)視頻通話AI體驗(yàn)也將于近期推出。
值得注意的是,騰訊在介紹混元2.0時(shí)提到,在主觀畫面質(zhì)量和美學(xué)層面的人工測(cè)評(píng)中,混元圖像2.0被認(rèn)為是“AI味”最少的模型之一。這表明,在基礎(chǔ)模型多元化發(fā)展的背景下,模型輸出結(jié)果的多元性和審美因素已開始成為重要的評(píng)價(jià)標(biāo)準(zhǔn)。
此次峰會(huì)的另一大亮點(diǎn)是騰訊的智能體戰(zhàn)略。隨著推理模型和多模態(tài)模型的快速發(fā)展,智能體成為今年大模型領(lǐng)域的熱點(diǎn)方向。騰訊將原有的大模型知識(shí)引擎升級(jí)為“騰訊云智能體開發(fā)平臺(tái)”,整合RAG技術(shù)和全面的Agent能力,助力企業(yè)快速激活私域知識(shí)并構(gòu)建專屬智能體。
騰訊云副總裁、騰訊云智能負(fù)責(zé)人、優(yōu)圖實(shí)驗(yàn)室負(fù)責(zé)人吳運(yùn)聲表示,升級(jí)智能體平臺(tái)旨在幫助企業(yè)真正用好智能體,而非停留在概念階段。大模型和多模態(tài)模型的發(fā)展顯著提升了語(yǔ)義理解、上下文建模等方面的能力,使得語(yǔ)義檢索、比對(duì)的準(zhǔn)確度大幅提升,視覺(jué)+文本協(xié)同任務(wù)成為可能。
騰訊還計(jì)劃在未來(lái)推出多尺寸混合推理模型,包括從0.5B到32B的dense模型以及激活13B的MoE模型,以滿足企業(yè)和端側(cè)的不同需求。同時(shí),混元圖像、視頻、3D等多模態(tài)基礎(chǔ)模型及配套插件模型也將持續(xù)開源。
目前,混元已深度融入騰訊各業(yè)務(wù)線,廣泛應(yīng)用于微信、QQ、騰訊元寶、騰訊會(huì)議、騰訊文檔等核心產(chǎn)品,提升內(nèi)部產(chǎn)品的智能化水平,并通過(guò)騰訊云向外輸出模型能力,助力企業(yè)和開發(fā)者創(chuàng)新提效。