国产98在线 | 传媒麻豆,久久―日本道色综合久久,久久久精品久久久久久久久久久,国产成人精品免费久久久久,五月综合色婷婷影院在线观看,久久久亚洲精品视频

  • 虎科技 - 領先的互聯(lián)網(wǎng)科技媒體

小米大模型團隊突破音頻推理,強化學習助力登頂MMAU榜首!

   時間:2025-03-17 13:30 來源:ITBEAR作者:唐云澤

小米大模型團隊在音頻推理領域取得了一項引人注目的成就。近日,該團隊宣布,他們受Deepseek-R1的啟發(fā),在國際權威的MMAU音頻理解評測中取得了突破,以64.5%的準確率登頂榜首,并且已經(jīng)將相關技術開源。

MMAU評測集,即大規(guī)模多任務音頻理解和推理評測集,是衡量音頻推理能力的重要標尺。它包含了一萬條涵蓋語音、環(huán)境聲和音樂的音頻樣本,并結合人類專家標注的問答對,測試模型在27種技能上的表現(xiàn),旨在推動模型達到接近人類專家的邏輯分析水平。然而,這一評測標準對人類來說也并非易事,人類專家在MMAU上的準確率也不過82.23%。

在小米大模型團隊登頂之前,MMAU官網(wǎng)榜單上的佼佼者是來自OpenAI的GPT-4o,其準確率為57.3%,緊隨其后的是Google DeepMind的Gemini 2.0 Flash,準確率為55.6%。而來自阿里的Qwen2-Audio-7B模型,在此評測集上的表現(xiàn)則為49.2%。

小米大模型團隊并未止步于Qwen2-Audio-7B模型的表現(xiàn)。他們利用該模型的開源特性,嘗試使用清華大學發(fā)布的AVQA數(shù)據(jù)集進行微調。AVQA數(shù)據(jù)集雖然僅包含3.8萬條訓練樣本,但通過全量有監(jiān)督微調(SFT),Qwen2-Audio-7B模型在MMAU上的準確率提升到了51.8%。這一初步成果為團隊后續(xù)的研究奠定了堅實的基礎。

DeepSeek-R1的發(fā)布為小米大模型團隊帶來了新的啟示。該模型采用的Group Relative Policy Optimization(GRPO)方法,使得模型能夠通過“試錯-獎勵”機制自主進化,涌現(xiàn)出類似人類的反思和多步驗證等推理能力。小米大模型團隊深受啟發(fā),嘗試將DeepSeek-R1的GRPO算法遷移到Qwen2-Audio-7B模型上。

經(jīng)過不懈的努力,小米大模型團隊最終取得了令人矚目的成果。在僅使用AVQA的3.8萬條訓練樣本的情況下,強化學習微調后的模型在MMAU評測集上實現(xiàn)了64.5%的準確率。這一成績不僅遠超Qwen2-Audio-7B模型微調前的表現(xiàn),也比目前榜單上第一名的商業(yè)閉源模型GPT-4o有近10個百分點的優(yōu)勢。

小米大模型團隊的這一成就,不僅展示了他們在音頻推理領域的強大實力,也為整個AI領域帶來了新的啟示。他們通過開源技術和創(chuàng)新算法的結合,推動了音頻理解和推理能力的提升,為未來的AI發(fā)展開辟了新的道路。

 
 
更多>同類內(nèi)容
推薦圖文
推薦內(nèi)容
點擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數(shù)碼群

主站蜘蛛池模板: 亚洲精品国产综合久久一线 | 五月婷婷伊人 | 国产精品久久久久一区二区 | 亚洲一区二区三区日本久久九 | 日本男人天堂网 | 国产男女免费完整版视频 | 毛片免费全部免费播放 | 亚洲国产一区二区三区亚瑟 | 午夜免费福利视频 | 俄罗斯24| 亚洲欧洲自拍偷拍 | 中文字幕永久免费视频 | 亚洲午夜视频在线观看 | 亚洲国内精品 | 自偷自拍亚洲综合精品 | 成人久久精品一区二区三区 | 色男天堂 | 看看的在线视频国产 | 四虎精品成人免费影视 | 久久99国产精品 | 五月综合色婷婷影院在线观看 | 亚洲国产观看 | 亚洲成年人在线 | 夜夜天堂 | 午夜在线观看福利 | 亚洲视频在线观看地址 | 亚洲欧美视频网站 | 欧美无吗| 国产亚洲欧洲一区二区三区 | 国产在线麻豆自在拍91精品 | 高清色 | 男女网站在线观看 | 日本欧美小视频 | 精品日韩在线观看 | 午夜欧美福利 | 亚洲精品免费观看 | 亚洲欧美一区二区三区另类 | 午夜视频免费在线观看 | 亚洲美女福利视频 | 久久精品国产免费看久久精品 | 人人爽人人爽人人片av |