国产98在线 | 传媒麻豆,久久―日本道色综合久久,久久久精品久久久久久久久久久,国产成人精品免费久久久久,五月综合色婷婷影院在线观看,久久久亚洲精品视频

  • 虎科技 - 領先的互聯(lián)網(wǎng)科技媒體

強化學習:AI Agent的智能引擎,還是發(fā)展路上的絆腳石?

   時間:2025-04-23 12:39 來源:ITBEAR作者:陸辰風

在人工智能領域,自主決策能力正逐漸成為衡量Agent價值的關鍵指標,也因此被視為AI時代的新基礎設施。然而,一些觀點認為,Workflow在此方面似乎存在局限性,難以打造出真正的通用Agent。

談及具備決策能力和自我意識的Agent,不得不提AlphaGo的問世。這是AI首次展現(xiàn)出非模板化、非規(guī)則驅動的智能行為。通過深度神經網(wǎng)絡與強化學習(RL),AlphaGo能夠自我對弈、自我優(yōu)化,最終擊敗人類頂級棋手,標志著Agent時代的到來。

Devin的出現(xiàn),可以被視為通用Agent發(fā)展的一個起點。它將AI的編碼能力、任務執(zhí)行與反饋機制整合為一個閉環(huán),為后續(xù)產品提供了寶貴的范例。Manus延續(xù)了Devin的思路,并提出“More Intelligence”的理念,通過任務拆解、自我反思、模型調度等方式,增強Agent的理解力和適應能力。而Genspark則采取了更加模塊化的路線,每個任務步驟都可組合,開發(fā)者可以快速搭建屬于自己的Agent系統(tǒng)。

盡管Workflow在構建Agent中扮演了一定角色,但業(yè)內逐漸形成共識:僅靠Workflow難以打造出真正的Agent。主流觀點認為,擁有基礎模型是構建Agent的起點,而RL則是賦予Agent連貫行為和目標感的“靈魂”。它決定了Agent如何理解環(huán)境反饋、進行長期規(guī)劃,是連接感知與行動的關鍵。

然而,Manus因缺乏底層模型能力和算法支撐,系統(tǒng)結構相對開放,容易被模仿。盡管如此,AI科技評論認為,這種批評有失公允,因為Manus在產品設計和任務編排上仍有不少創(chuàng)新之處。那些堅持深耕強化學習的團隊,在新一輪技術演進中逐漸走到了前沿位置。

Pokee AI創(chuàng)始人朱哲清,前meta AI應用強化學習團隊負責人,就是RL的堅定信仰者。他認為,RL的核心優(yōu)勢在于目標驅動,圍繞清晰目標進行策略規(guī)劃和任務執(zhí)行。缺少RL,Agent容易陷入“走一步看一步”的模式,缺乏內在驅動力,難以勝任復雜任務。

朱哲清表示,真正的Agent不僅要有執(zhí)行能力,還要對環(huán)境產生不可逆的影響。Workflow產品仍處于早期階段,需要人為干預。真正的Agent能夠根據(jù)給定目標,自主選擇和使用工具完成任務。他認為,Agent的發(fā)展可分為多個階段,從Zapier的工作流系統(tǒng),到LangChain的可組合型任務執(zhí)行模式,再到Claude做MCP的演進,最終將實現(xiàn)自主性與智能性的前所未有的水平。

然而,并非所有人都對RL持樂觀態(tài)度。香港科技大學(廣州)博士生、DeepWisdom研究員張佳釔認為,現(xiàn)有RL技術雖能在特定環(huán)境中提升Agent能力,但本質上是“任務特化”,而非真正的智能泛化。他強調,跨環(huán)境智能體才是目標,而RL在跨環(huán)境學習上面臨困境。他認為,即便使用RL對語言模型進行環(huán)境內優(yōu)化,若基礎模型能力較弱,即便訓練到“最優(yōu)”,也只是對單一環(huán)境的適配,缺乏跨環(huán)境泛化能力。

張佳釔將Agent的發(fā)展過程分為六個階段,目前大多數(shù)Agent產品公司仍處于第二到第三階段之間,尚未邁過第四階段的門檻。他認為,突破當前瓶頸的關鍵在于使Agent擺脫人類預設經驗的束縛,通過自主探索獲取跨環(huán)境經驗,并學會與各類專業(yè)Agent協(xié)作。

Follou創(chuàng)始人謝揚則持有不同觀點。他認為,Agent和工作流自動化可以組合起來,Agent應成為協(xié)助人類提升生產力的工具,而非獨立個體。他更關心Agent是否能在現(xiàn)實中幫人把一件事做完,無論是搜索信息、分析數(shù)據(jù),還是調度工具。在他看來,很多人過于執(zhí)著于“Agent是否像人”,而忽略了其真正的應用意義。

謝揚表示,衡量一個Agent是否有生命力,關鍵在于它是否“可組合”“可調度”。只有將Agent靈活地組織在不同的垂直任務中,支持模塊化的能力組合,并與人類實現(xiàn)高效協(xié)同,它才真正具備長期應用的可能性。基于此理念,F(xiàn)ollou構建了一套融合Agent與工作流的架構體系。

在RL信徒與質疑者的觀點交鋒中,一個趨勢逐漸清晰:Agent的演化不再是單一范式的勝利,而是多種技術路線的協(xié)同博弈。構建Agent需要模型能力、目標規(guī)劃和執(zhí)行機制等多方面的精密協(xié)作。RL塑造目標感,模型提供理解力,外部接口延展執(zhí)行力,三者缺一不可。如何將這些能力組合在一起,真正打造一個可泛化、可遷移的系統(tǒng),是Agent走向通用市場的關鍵。

 
 
更多>同類內容
推薦圖文
推薦內容
點擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數(shù)碼群

主站蜘蛛池模板: 最近免费中文完整视频观看 | 精品欧美一区二区精品久久 | 最新国产成人综合在线观看 | 伊人伊网| gogo大胆高清免费视频 | 久久精品久 | 中文字幕avv | 欧美日韩亚洲综合 | 久久精品成人欧美大片免费 | 日本高清一区 | 综合一区 | 亚洲播放 | a男人天堂 | 俄罗斯三级完整版在线观看 | 一级片在线免费 | 99久久精品国产高清一区二区 | 男人的天堂97 | 四虎永久免费地址 | 四虎影院的网址 | 亚洲国产精品看片在线观看 | 欧美色伊人 | 最新在线精品国自拍视频 | 国产色片在线观看 | 日本高清免费在线视频 | 亚洲国产精品67194成人 | 在线观看中文字幕2021 | 精品中文字幕乱码一区二区 | 欧美福利网| 婷婷丁香在线视频 | 羞羞电影网 | 激情五月婷婷小说 | 免费在线欧美 | 久久成人性色生活片 | 综合五月激情 | 伊人久久婷婷丁香六月综合基地 | 国产无限制自拍 | 自拍 亚洲 | 午夜啪啪福利视频 | 亚洲精品不卡久久久久久 | 亚洲福利国产 | 伊人婷婷综合缴情亚洲五月 |