国产98在线 | 传媒麻豆,久久―日本道色综合久久,久久久精品久久久久久久久久久,国产成人精品免费久久久久,五月综合色婷婷影院在线观看,久久久亚洲精品视频

  • 虎科技 - 領(lǐng)先的互聯(lián)網(wǎng)科技媒體

強(qiáng)化學(xué)習(xí):AI Agent的智能引擎,還是發(fā)展路上的絆腳石?

   時(shí)間:2025-04-23 12:39 來(lái)源:ITBEAR作者:陸辰風(fēng)

在人工智能領(lǐng)域,自主決策能力正逐漸成為衡量Agent價(jià)值的關(guān)鍵指標(biāo),也因此被視為AI時(shí)代的新基礎(chǔ)設(shè)施。然而,一些觀點(diǎn)認(rèn)為,Workflow在此方面似乎存在局限性,難以打造出真正的通用Agent。

談及具備決策能力和自我意識(shí)的Agent,不得不提AlphaGo的問(wèn)世。這是AI首次展現(xiàn)出非模板化、非規(guī)則驅(qū)動(dòng)的智能行為。通過(guò)深度神經(jīng)網(wǎng)絡(luò)與強(qiáng)化學(xué)習(xí)(RL),AlphaGo能夠自我對(duì)弈、自我優(yōu)化,最終擊敗人類頂級(jí)棋手,標(biāo)志著Agent時(shí)代的到來(lái)。

Devin的出現(xiàn),可以被視為通用Agent發(fā)展的一個(gè)起點(diǎn)。它將AI的編碼能力、任務(wù)執(zhí)行與反饋機(jī)制整合為一個(gè)閉環(huán),為后續(xù)產(chǎn)品提供了寶貴的范例。Manus延續(xù)了Devin的思路,并提出“More Intelligence”的理念,通過(guò)任務(wù)拆解、自我反思、模型調(diào)度等方式,增強(qiáng)Agent的理解力和適應(yīng)能力。而Genspark則采取了更加模塊化的路線,每個(gè)任務(wù)步驟都可組合,開(kāi)發(fā)者可以快速搭建屬于自己的Agent系統(tǒng)。

盡管Workflow在構(gòu)建Agent中扮演了一定角色,但業(yè)內(nèi)逐漸形成共識(shí):僅靠Workflow難以打造出真正的Agent。主流觀點(diǎn)認(rèn)為,擁有基礎(chǔ)模型是構(gòu)建Agent的起點(diǎn),而RL則是賦予Agent連貫行為和目標(biāo)感的“靈魂”。它決定了Agent如何理解環(huán)境反饋、進(jìn)行長(zhǎng)期規(guī)劃,是連接感知與行動(dòng)的關(guān)鍵。

然而,Manus因缺乏底層模型能力和算法支撐,系統(tǒng)結(jié)構(gòu)相對(duì)開(kāi)放,容易被模仿。盡管如此,AI科技評(píng)論認(rèn)為,這種批評(píng)有失公允,因?yàn)镸anus在產(chǎn)品設(shè)計(jì)和任務(wù)編排上仍有不少創(chuàng)新之處。那些堅(jiān)持深耕強(qiáng)化學(xué)習(xí)的團(tuán)隊(duì),在新一輪技術(shù)演進(jìn)中逐漸走到了前沿位置。

Pokee AI創(chuàng)始人朱哲清,前meta AI應(yīng)用強(qiáng)化學(xué)習(xí)團(tuán)隊(duì)負(fù)責(zé)人,就是RL的堅(jiān)定信仰者。他認(rèn)為,RL的核心優(yōu)勢(shì)在于目標(biāo)驅(qū)動(dòng),圍繞清晰目標(biāo)進(jìn)行策略規(guī)劃和任務(wù)執(zhí)行。缺少RL,Agent容易陷入“走一步看一步”的模式,缺乏內(nèi)在驅(qū)動(dòng)力,難以勝任復(fù)雜任務(wù)。

朱哲清表示,真正的Agent不僅要有執(zhí)行能力,還要對(duì)環(huán)境產(chǎn)生不可逆的影響。Workflow產(chǎn)品仍處于早期階段,需要人為干預(yù)。真正的Agent能夠根據(jù)給定目標(biāo),自主選擇和使用工具完成任務(wù)。他認(rèn)為,Agent的發(fā)展可分為多個(gè)階段,從Zapier的工作流系統(tǒng),到LangChain的可組合型任務(wù)執(zhí)行模式,再到Claude做MCP的演進(jìn),最終將實(shí)現(xiàn)自主性與智能性的前所未有的水平。

然而,并非所有人都對(duì)RL持樂(lè)觀態(tài)度。香港科技大學(xué)(廣州)博士生、DeepWisdom研究員張佳釔認(rèn)為,現(xiàn)有RL技術(shù)雖能在特定環(huán)境中提升Agent能力,但本質(zhì)上是“任務(wù)特化”,而非真正的智能泛化。他強(qiáng)調(diào),跨環(huán)境智能體才是目標(biāo),而RL在跨環(huán)境學(xué)習(xí)上面臨困境。他認(rèn)為,即便使用RL對(duì)語(yǔ)言模型進(jìn)行環(huán)境內(nèi)優(yōu)化,若基礎(chǔ)模型能力較弱,即便訓(xùn)練到“最優(yōu)”,也只是對(duì)單一環(huán)境的適配,缺乏跨環(huán)境泛化能力。

張佳釔將Agent的發(fā)展過(guò)程分為六個(gè)階段,目前大多數(shù)Agent產(chǎn)品公司仍處于第二到第三階段之間,尚未邁過(guò)第四階段的門(mén)檻。他認(rèn)為,突破當(dāng)前瓶頸的關(guān)鍵在于使Agent擺脫人類預(yù)設(shè)經(jīng)驗(yàn)的束縛,通過(guò)自主探索獲取跨環(huán)境經(jīng)驗(yàn),并學(xué)會(huì)與各類專業(yè)Agent協(xié)作。

Follou創(chuàng)始人謝揚(yáng)則持有不同觀點(diǎn)。他認(rèn)為,Agent和工作流自動(dòng)化可以組合起來(lái),Agent應(yīng)成為協(xié)助人類提升生產(chǎn)力的工具,而非獨(dú)立個(gè)體。他更關(guān)心Agent是否能在現(xiàn)實(shí)中幫人把一件事做完,無(wú)論是搜索信息、分析數(shù)據(jù),還是調(diào)度工具。在他看來(lái),很多人過(guò)于執(zhí)著于“Agent是否像人”,而忽略了其真正的應(yīng)用意義。

謝揚(yáng)表示,衡量一個(gè)Agent是否有生命力,關(guān)鍵在于它是否“可組合”“可調(diào)度”。只有將Agent靈活地組織在不同的垂直任務(wù)中,支持模塊化的能力組合,并與人類實(shí)現(xiàn)高效協(xié)同,它才真正具備長(zhǎng)期應(yīng)用的可能性?;诖死砟睿現(xiàn)ollou構(gòu)建了一套融合Agent與工作流的架構(gòu)體系。

在RL信徒與質(zhì)疑者的觀點(diǎn)交鋒中,一個(gè)趨勢(shì)逐漸清晰:Agent的演化不再是單一范式的勝利,而是多種技術(shù)路線的協(xié)同博弈。構(gòu)建Agent需要模型能力、目標(biāo)規(guī)劃和執(zhí)行機(jī)制等多方面的精密協(xié)作。RL塑造目標(biāo)感,模型提供理解力,外部接口延展執(zhí)行力,三者缺一不可。如何將這些能力組合在一起,真正打造一個(gè)可泛化、可遷移的系統(tǒng),是Agent走向通用市場(chǎng)的關(guān)鍵。

 
 
更多>同類內(nèi)容
推薦圖文
比亞迪騰勢(shì)Z概念跑車亮相上海車展,全棧自研技術(shù)引領(lǐng)未來(lái)出行 smart精靈#5 BRABUS超能版震撼登場(chǎng),雙電機(jī)四驅(qū)僅售32.99萬(wàn)起!
本田“燁”品牌GT車型驚艷登場(chǎng),雙時(shí)空智享座艙引領(lǐng)未來(lái)出行 華為乾崑智駕ADS系統(tǒng)全解析:四版本各領(lǐng)風(fēng)騷,你適合哪款?
推薦內(nèi)容
點(diǎn)擊排行
 
智快科技微信賬號(hào)
ITBear微信賬號(hào)

微信掃一掃
加微信拉群
電動(dòng)汽車群
科技數(shù)碼群

主站蜘蛛池模板: www.激情网.com| 综合久久网 | 久草电影天堂 | 四虎4545www国产精品 | 亚洲男人的天堂成人 | 亚洲国产欧美一区二区欧美 | 婷婷激情五月综合 | 亚洲一区二区三区精品影院 | 小视频app网站 | 偷自拍第一页 | 亚洲免费综合色在线视频 | 久久久麻豆 | 五月婷婷欧美 | 中文字幕日本亚洲欧美不卡 | 女男羞羞视频网站免费 | 久久精品久久精品 | www.婷婷色 | 日韩成人中文字幕 | 日本欧美在线视频 | 亚洲精品视频免费 | 国产一区亚洲欧美成人 | 国产一区二区精品久久小说 | 性欧美大战久久久久久久野外 | 亚洲国内精品 | 亚洲精品久中文字幕 | 亚洲综合在线观看视频 | 视频一区精品 | 伊人网影院 | 日本久久久久亚洲中字幕 | 美女被爆羞羞视频网站视频 | 久热这里只有精品视频6 | 在线你懂| 日本欧美在线观看 | 亚洲成人免费电影 | 精品400部自拍视频在线播放 | 婷婷综合激情五月中文字幕 | 在线观看网址你懂的 | 老子午夜影院 | 国产精品视频导航 | 亚洲免费精品视频 | 综合在线视频 |