国产98在线 | 传媒麻豆,久久―日本道色综合久久,久久久精品久久久久久久久久久,国产成人精品免费久久久久,五月综合色婷婷影院在线观看,久久久亚洲精品视频

  • 虎科技 - 領先的互聯(lián)網(wǎng)科技媒體

英偉達RL新突破:Nemotron-N1系列模型,深度強化AI決策力

   時間:2025-05-14 14:28 來源:ITBEAR作者:顧青青

近期,科技界傳來一則新動態(tài),英偉達攜手賓夕法尼亞州立大學及華盛頓大學,共同推出了名為Nemotron-Research-Tool-N1系列的新模型。這一系列模型受到了DeepSeek-R1的啟發(fā),并采用了創(chuàng)新的強化學習(RL)范式,旨在增強模型的推理能力。

在大型語言模型(LLMs)領域,通過整合外部工具來提升性能已成為一種流行趨勢。這些工具使得LLMs在搜索引擎、計算器、視覺處理及Python解釋器等多個領域展現(xiàn)出了卓越的性能。然而,現(xiàn)有的研究方法大多依賴于合成數(shù)據(jù)集,難以捕捉到明確的推理步驟,導致模型往往只能模仿表面的模式,而無法真正理解背后的決策過程。

為了克服這一挑戰(zhàn),研究者們積極探索了多種策略來提升LLMs的工具使用能力。一方面,他們通過整理數(shù)據(jù)集和優(yōu)化模型,創(chuàng)建了大規(guī)模的監(jiān)督數(shù)據(jù)集,并運用了監(jiān)督微調(diào)(SFT)和直接偏好優(yōu)化(DPO)等強化學習技術,將LLMs與外部工具相結合,進一步擴展其功能。另一方面,研究者們也在不斷改進推理過程,從傳統(tǒng)的訓練時擴展轉(zhuǎn)向更為復雜的測試時策略。

盡管這些方法在一定程度上取得了成效,但它們?nèi)匀皇芟抻诤铣蓴?shù)據(jù)的不足。通過現(xiàn)有的策略,LLMs雖然能夠處理單輪或多輪的工具調(diào)用,但在自主推理的深度上仍顯不足。為了突破這一局限,英偉達及其合作伙伴開發(fā)了Nemotron-Research-Tool-N1系列模型。

Nemotron-Research-Tool-N1系列模型并未依賴顯式的推理軌跡標注,而是采用了一種二元獎勵機制,鼓勵模型自主發(fā)展推理策略。研究者們對xLAM和ToolACE等數(shù)據(jù)集(包含單輪和多輪工具調(diào)用軌跡)的子集進行了統(tǒng)一處理,并設計了一種輕量級的提示模板,以指導工具生成過程。這種模板通過使用特定的標簽來明確指示中間推理步驟,并封裝工具調(diào)用,從而避免了模型過度擬合特定的提示模式。

在模型的主干部分,研究者們選擇了Qwen2.5-7B和14B,并測試了LLaMA系列的變體,以評估模型的泛化能力。在BFCL基準測試中,Nemotron-Research-Tool-N1-7B和14B模型展現(xiàn)出了卓越的性能,不僅超越了GPT-4o等封閉源模型,還優(yōu)于xLAM-2-70B和ToolACE-8B等經(jīng)過專用微調(diào)的模型。

與采用相同數(shù)據(jù)源的SFT基準相比,Nemotron-Research-Tool-N1系列模型展現(xiàn)出了顯著的優(yōu)勢,這充分證明了強化學習方法的有效性。在API-Bank基準測試中,Tool-N1-7B和14B的準確率分別比GPT-4o高出了4.12%和5.03%。這些結果不僅驗證了新方法的巨大潛力,還表明LLMs在自主生成推理策略方面取得了重要進展。這一突破標志著從傳統(tǒng)的監(jiān)督微調(diào)向強化學習范式的轉(zhuǎn)變。

 
 
更多>同類內(nèi)容
推薦圖文
推薦內(nèi)容
點擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數(shù)碼群

主站蜘蛛池模板: 久久久久久久国产精品毛片 | 噜噜噜在线视频免费观看 | 五色月 | 性生活视频网站 | 亚洲国产小视频 | 狠狠色丁香婷婷综合小时婷婷 | 亚洲精品不卡久久久久久 | 亚洲美女爱爱 | 五月婷婷丁香花 | 亚洲成人婷婷 | 在线播放你懂的 | 色婷婷色综合激情国产日韩 | 六月丁香深爱六月综合激情 | 国产免费自拍 | 国产精品视频福利一区二区 | 草天堂| 欧美激情五月 | 亚洲欧美视频在线 | 一区二区三区久久 | 丁香婷婷激情 | 五月婷婷在线观看 | 羞羞视频入口网站 | 一区二区三区在线 | 国产噜噜噜视频在线观看 | 亚洲精品午夜视频 | 亚洲免费综合色在线视频 | 在线99 | 羞羞视频在线观看网站 | 中文字幕在线不卡 | 国产99久久久国产精品免费直播 | 三妻四妾韩国电影完整版在线播放 | 色激情五月 | 五月激情在线 | 亚洲国产精品人人做人人爽 | 色婷婷激情五月 | 四虎www| 欧美久久影院 | 欧美成人黑人xx视频免费观看 | 开心色99xxxx开心色 | 最新自拍偷拍 | 在线国产区|