在AI技術的浪潮中,三位來自不同年代、性格迥異的年輕人正站在具身智能領域的最前沿,他們分別是98年出生的吳銘東、01年出生的譚恒楷和02年出生的王乾旭。他們雖然背景不同,但都對具身智能充滿熱情,渴望在這個日新月異的時代留下自己的足跡。
譚恒楷,清華計算機系的直博生,從小就展現出了對科學問題的濃厚興趣和探究精神。他常常問自己一些深奧的問題,如宇宙的邊界、生命的奧秘等。接觸具身智能后,他更是沉迷于研究機器人如何在物理世界中實現自主操作。他帶領團隊研發出了一種基于擴散模型的具身大模型RDT-1B,通過整合互聯網上的大量機器人操作數據,實現了機器人空間泛化的抓取和倒水等操作任務。然而,譚恒楷并沒有止步于此,他意識到action數據的稀缺是具身智能的本質問題,于是提出了用image space替代action space的新思路,并成功構建了VIDAR模型。
吳銘東,北大圖靈班的一員,自高中時期就對AI機器人充滿了憧憬。他認為,機器人能夠解放人類的雙手,使人類能夠更專注于解決社會問題。在導師董豪的帶領下,吳銘東投身于具身智能的研究,并成功復現了全球首個真機強化學習(SERL)工作。他深知,具身智能要真正落地,還需要解決適應性和成功率的問題。因此,他一直在探索如何通過軟硬件結合的方式,提高機器人在真實世界中的操作成功率。
王乾旭,一個從小被放養長大的吉林長春人,卻意外地在高中時期展現出了卓越的學習能力。他考入了北大計算機系,并在大二下學期轉入了董豪教授的Agibot實驗室,開始接觸具身智能。在斯坦福暑研期間,他受到了何愷明教授的啟發,開始思考如何設計一個接口,將視覺模塊和控制模塊解耦,讓機器人能夠從不同的數據源中學習信息。他相信,通過定義統一的數據表示方式,機器人將能夠像視覺模型一樣收集數據,并將學到的知識應用到各種機器人上。
這三位年輕人雖然性格各異,但都對具身智能充滿了熱愛和執著。譚恒楷敢于劍走偏鋒,提出了用image space替代action space的新思路;吳銘東注重調查和實踐,不斷探索提高機器人操作成功率的方法;王乾旭則善于交流和合作,通過與不同領域的專家交流,不斷拓寬自己的視野和思路。他們用自己的實際行動,詮釋了Z世代年輕人的癡、敢、愛和狂。
在AI時代,年齡和資歷已經不再是衡量一個人能力的標準。這三位年輕人憑借著自己的熱情和執著,在具身智能領域取得了令人矚目的成果。他們的故事告訴我們,只要有夢想、有勇氣、有毅力,就能夠在這個日新月異的時代中闖出一片天地。
展望未來,具身智能領域還有很長的路要走。但有了這些年輕人的加入和努力,我們有理由相信,這個領域將會迎來更加美好的明天。