在人工智能領(lǐng)域,商湯科技這家成立僅十年的公司,正以其獨(dú)特的視角和技術(shù)實(shí)力,在大模型競(jìng)賽中嶄露頭角。過(guò)去,商湯以計(jì)算機(jī)視覺(jué)技術(shù)見(jiàn)長(zhǎng),與當(dāng)前以自然語(yǔ)言處理為主的大模型浪潮看似格格不入。然而,隨著DeepSeek R1的發(fā)布,這一格局被徹底打破。
DeepSeek R1的出現(xiàn),不僅讓語(yǔ)言大模型的競(jìng)爭(zhēng)更加激烈,也讓商湯的技術(shù)實(shí)力得到了前所未有的展現(xiàn)。在ChatGPT之后,各大語(yǔ)言模型廠商紛紛投入巨資研發(fā)GPT-4的升級(jí)版,但DeepSeek R1的橫空出世,幾乎抹平了這些努力帶來(lái)的差距。面對(duì)這一挑戰(zhàn),行業(yè)內(nèi)的玩家面臨兩個(gè)選擇:要么緊跟DeepSeek的步伐,繼續(xù)提升語(yǔ)言大模型的性能,要么尋找差異化的競(jìng)爭(zhēng)點(diǎn)。
值得注意的是,商湯并沒(méi)有局限于語(yǔ)言大模型的競(jìng)爭(zhēng)。根據(jù)權(quán)威研究機(jī)構(gòu)EPOCH AI的調(diào)查,用于訓(xùn)練大語(yǔ)言模型的文本數(shù)據(jù)正在迅速接近危機(jī)點(diǎn),預(yù)計(jì)到2028年,語(yǔ)言大模型的訓(xùn)練數(shù)據(jù)集將耗盡互聯(lián)網(wǎng)的所有可用文本數(shù)量。與此同時(shí),語(yǔ)言大模型也呈現(xiàn)出性能隨參數(shù)規(guī)模加大而提升的邊際效益遞減趨勢(shì)。因此,商湯將目光投向了多模態(tài)大模型,這一被視為邁向通用人工智能(AGI)的關(guān)鍵一步。
經(jīng)過(guò)兩年的努力,商湯成功推出了新一代6000億參數(shù)的多模態(tài)大模型“日日新 Sense Nova V6”。這款模型在多模態(tài)綜合能力上,不僅與GPT-4.5和Gemini 2.0 Pro相當(dāng),甚至在某些方面略有超越。更重要的是,商湯還引入了長(zhǎng)思維鏈技術(shù),將多模態(tài)與深度思考相結(jié)合,為模型增添了更強(qiáng)的推理能力。
商湯在多模態(tài)大模型領(lǐng)域的突破,并非一蹴而就。從2024年年中開(kāi)始,商湯就開(kāi)始探索原生融合的多模態(tài)大模型,并在今年1月10日,即DeepSeek R1發(fā)布并爆火前,就已經(jīng)登上了SuperCLUE和OpenCompass兩大權(quán)威榜單榜首,成為大語(yǔ)言與多模態(tài)能力的“雙冠王”。這一成就,無(wú)疑證明了商湯在大模型領(lǐng)域的深厚底蘊(yùn)和創(chuàng)新能力。
商湯的技術(shù)優(yōu)勢(shì)不僅體現(xiàn)在多模態(tài)大模型上,還體現(xiàn)在其大裝置與商業(yè)積累的緊密協(xié)同上。商湯的大裝置在算力上領(lǐng)先行業(yè)至少3年,為大模型的訓(xùn)練提供了強(qiáng)有力的支持。同時(shí),商湯在過(guò)去十年中積累的商業(yè)化實(shí)戰(zhàn)經(jīng)驗(yàn),也為其在大模型市場(chǎng)的競(jìng)爭(zhēng)中提供了獨(dú)特的優(yōu)勢(shì)。這使得商湯在推出日日新V6后,能夠迅速將其應(yīng)用于各行各業(yè),推動(dòng)AI技術(shù)的落地和應(yīng)用。
在日日新V6的推動(dòng)下,商湯的多模態(tài)大模型已經(jīng)能夠在數(shù)學(xué)解題、點(diǎn)讀翻譯、文旅講解、繪本講解等日常高頻需求的響應(yīng)中,取得相較于以往多模態(tài)模型更出色的性能表現(xiàn)。同時(shí),商湯還與傅利葉等機(jī)器人廠商合作,探索了V6與終端結(jié)合的可能性,為具身智能的發(fā)展提供了新的思路。
商湯在辦公領(lǐng)域也取得了顯著的進(jìn)展。其小浣熊系列產(chǎn)品,借助V6的多模態(tài)深度思考與推理能力,實(shí)現(xiàn)了任務(wù)規(guī)劃、數(shù)據(jù)分析、文檔編輯等能力的大幅提升。這不僅提升了辦公效率,還為AI技術(shù)在辦公領(lǐng)域的應(yīng)用提供了新的可能。
在商業(yè)化方面,商湯的表現(xiàn)同樣亮眼。根據(jù)2024年的財(cái)報(bào),商湯生成式AI的業(yè)務(wù)收入達(dá)到24億元,在總收入中的占比高達(dá)63.7%,同比漲幅超過(guò)100%。這一成績(jī),不僅證明了商湯在大模型領(lǐng)域的商業(yè)潛力,也為其未來(lái)的發(fā)展奠定了堅(jiān)實(shí)的基礎(chǔ)。
商湯并沒(méi)有局限于To C市場(chǎng)的競(jìng)爭(zhēng),而是更加注重To B市場(chǎng)的拓展。從構(gòu)建人工智能時(shí)代的“終局思維”來(lái)看,推動(dòng)更多行業(yè)、更多需求轉(zhuǎn)向“AI-Native”對(duì)商湯來(lái)說(shuō)比加大投入追求SuperApp更有價(jià)值。因此,商湯將日日新大模型系列廣泛應(yīng)用于WPS、閱文、想法流等多個(gè)明星C端應(yīng)用的同時(shí),也積極拓展B端業(yè)務(wù),為更多行業(yè)提供AI技術(shù)解決方案。
在算力、算法、用戶與商業(yè)這一完整的模型體系中,商湯憑借其大裝置與商業(yè)積累的優(yōu)勢(shì),成功啟動(dòng)了飛輪效應(yīng)。隨著日日新V6的發(fā)布,商湯多模態(tài)大模型的實(shí)力得到了極大提升,算法飛輪也展現(xiàn)出了巨大的潛力。未來(lái),商湯將繼續(xù)深耕大模型領(lǐng)域,推動(dòng)AI技術(shù)的創(chuàng)新與應(yīng)用,為人工智能時(shí)代的發(fā)展貢獻(xiàn)更多力量。