近日,國內(nèi)知名的第三方評測權(quán)威機(jī)構(gòu)SuperCLUE揭曉了中文原生工業(yè)大模型評測新標(biāo)桿——SC-Industry(SuperCLUE-Industry)的最新排名。北電數(shù)智旗下的驕陽·工業(yè)大模型在此次評測中以總分83.44的佳績,榮登榜首。
SuperCLUE作為業(yè)界公認(rèn)的中文大模型綜合評測基準(zhǔn),此次發(fā)布的SC-Industry評測框架,專為中文語義環(huán)境與國內(nèi)工業(yè)應(yīng)用場景設(shè)計(jì),旨在全面評估工業(yè)大模型在解決實(shí)際工業(yè)問題上的能力,同時(shí)考量模型的通用性和可擴(kuò)展性。評測涵蓋了基礎(chǔ)能力和應(yīng)用能力兩大維度,具體包括工業(yè)常規(guī)問答、工業(yè)數(shù)據(jù)分析、工業(yè)文檔問答、工業(yè)智能體Agent、工業(yè)理解計(jì)算、工業(yè)代碼生成等六大核心能力。
在SC-Industry的評測中,驕陽·工業(yè)大模型不僅在總分上獨(dú)占鰲頭,其應(yīng)用能力更是以90.07分的優(yōu)異成績位列第一。特別是在工業(yè)數(shù)據(jù)分析方面,驕陽·工業(yè)大模型以90.38分的最高分展現(xiàn)了其在表格類數(shù)據(jù)分析上的卓越能力,提供了深入的行業(yè)洞察。在工業(yè)智能體Agent的評測中,該模型同樣表現(xiàn)出色,以89.97分的高分領(lǐng)跑,展現(xiàn)了其在復(fù)雜工業(yè)環(huán)境中自主或半自主執(zhí)行任務(wù)、做出有效決策以及與其他系統(tǒng)交互優(yōu)化工業(yè)流程的能力。
SuperCLUE在評測報(bào)告中強(qiáng)調(diào),產(chǎn)業(yè)級(jí)應(yīng)用能力已成為當(dāng)前工業(yè)大模型發(fā)展的新分水嶺。驕陽·工業(yè)大模型在工業(yè)數(shù)據(jù)分析上的強(qiáng)勢表現(xiàn),不僅彰顯了國產(chǎn)模型在工業(yè)任務(wù)能力上的突破,也表明在基礎(chǔ)能力日益趨同的背景下,工業(yè)數(shù)據(jù)分析與智能體表現(xiàn)將成為拉開模型差距的關(guān)鍵因素。北電數(shù)智通過推動(dòng)工業(yè)數(shù)據(jù)標(biāo)準(zhǔn)和開放協(xié)議體系的建立,運(yùn)用可信數(shù)據(jù)空間技術(shù)實(shí)現(xiàn)數(shù)據(jù)安全共享,同時(shí)研發(fā)場景化微調(diào)數(shù)據(jù)生成和復(fù)雜任務(wù)強(qiáng)化學(xué)習(xí)等核心技術(shù),有效提升了模型的行業(yè)認(rèn)知能力。
據(jù)悉,北電數(shù)智即將在2025世界人工智能大會(huì)(WAIC)上正式發(fā)布驕陽·工業(yè)大模型。屆時(shí),北電數(shù)智將聚焦工業(yè)企業(yè)最為關(guān)注的“AI+生產(chǎn)、AI+產(chǎn)品、AI+運(yùn)營、AI+基礎(chǔ)設(shè)施”等核心業(yè)務(wù)場景,分享其創(chuàng)新能力和標(biāo)桿實(shí)踐,期待為行業(yè)帶來更多驚喜。