近期,理想汽車內部傳來人事變動消息,其輔助駕駛“端到端”模型負責人夏中譜即將離職。夏中譜在理想汽車的職級高達21級,直接向輔助駕駛研發副總裁郎咸朋匯報工作。
據知情人士透露,夏中譜已悄然退出理想最新的輔助駕駛方案VLA項目組,并在數周內未參與相關業務例會。盡管離職的具體去向尚未明確,但這一變動已在業內引起廣泛關注。
夏中譜于2023年加入理想汽車,主要負責輔助駕駛系統的規劃控制模型。在此之前,他曾在百度自動駕駛部門擔任重要職務。在理想汽車的兩年時間里,夏中譜憑借出色的工作表現,職級從P9(對應理想新職級體系19級)迅速升至21級,這樣的升職速度在理想內部實屬罕見。
然而,夏中譜的離職或與理想汽車輔助駕駛技術路線的變更有關。據知情人士透露,夏中譜對“端到端”路線持優化空間看法,但理想內部已決定押注VLA(Vision-Language-Action,視覺-語言-動作)模型路線。這一決策或許成為雙方分道揚鑣的導火索。
5月7日,理想汽車CEO李想在AI Talk中詳細介紹了VLA模型的優勢。他稱VLA為一個像人類司機一樣工作的司機大模型,并透露理想為此投入了超過預期3倍的訓練卡數。這一技術路線的轉變,意味著理想汽車在自動駕駛領域邁出了新的一步。
事實上,理想汽車的輔助駕駛技術路線在過去一年中經歷了多次切換。從依賴高精地圖、基于規則的方案,到“端到端”方案,再到如今的VLA模型路線,理想汽車不斷探索和嘗試,以期在自動駕駛領域取得更大突破。
“端到端”方案的落地,曾是理想汽車打響名聲的關鍵之戰。該方案由特斯拉率先實踐落地,相比以往依賴工程師手寫的規則方案,“端到端”更加依賴AI模型的自主學習能力。理想汽車的“端到端”方案從立項到全量推送,僅用了不到一年的時間,并因此擺脫了輔助駕駛“落后生”的身份,迅速擠入行業第一梯隊。
然而,理想汽車并未將“端到端”視為自動駕駛的終極答案。李想在AI Talk中表示,“端到端”并不完全理解物理世界,更像一種模仿行為。面對復雜場景時,該方案可能會遇到問題。因此,理想汽車決定探索VLA模型路線。
VLA模型最早由谷歌AI公司Deepmind推出,主要用于機器人領域。與ChatGPT、Sora等視覺語言模型(VLM)不同,VLA新增了與物理世界交互的“動作”能力。這意味著VLA不僅能理解周圍環境,還能直接輸出控制指令,如機器人動作或車輛駕駛決策等。這一特性使得VLA在輔助駕駛領域具有廣闊的應用前景。
理想汽車認為,VLA能通過3D和2D視覺的組合,完整地看到物理世界。同時,VLA擁有完整的腦系統,具備語言、CoT(思維鏈)推理能力。這些特性使得VLA既能看、也能理解并真正執行動作,符合人類的運作方式。因此,理想汽車決定All in VLA大模型,以期在自動駕駛領域取得更大突破。
隨著“端到端”舊路線技術負責人夏中譜的離職,理想汽車All in VLA大模型的態度更加堅決。這一決策不僅體現了理想汽車在自動駕駛領域的決心和勇氣,也預示著該領域將迎來新的變革和挑戰。