国产98在线 | 传媒麻豆,久久―日本道色综合久久,久久久精品久久久久久久久久久,国产成人精品免费久久久久,五月综合色婷婷影院在线观看,久久久亚洲精品视频

  • 虎科技 - 領(lǐng)先的互聯(lián)網(wǎng)科技媒體

蘋果復(fù)旦聯(lián)手打造StreamBridge,突破端側(cè)視頻大語言模型理解瓶頸

   時間:2025-05-13 14:32 來源:ITBEAR作者:馮璃月

近期,科技界傳來一則令人矚目的合作消息。據(jù)科技媒體報道,蘋果公司攜手復(fù)旦大學(xué),共同推出了名為StreamBridge的端側(cè)視頻大語言模型(Video-LLMs)框架,該框架專注于提升AI對直播流視頻的理解能力。

在探討直播流視頻理解的需求與挑戰(zhàn)時,我們不得不提及傳統(tǒng)視頻大語言模型的局限性。盡管它們在處理靜態(tài)視頻方面表現(xiàn)出色,但在諸如機器人技術(shù)和自動駕駛等需要實時感知的領(lǐng)域,卻顯得力不從心。這些場景要求模型能夠迅速理解直播視頻流的內(nèi)容,并據(jù)此作出反應(yīng)。

當前,模型面臨的主要難題包括多輪實時理解和主動響應(yīng)。多輪實時理解意味著模型在處理最新視頻片段時,需要保留歷史視覺和對話上下文,而主動響應(yīng)則要求模型能夠像人類一樣主動監(jiān)控視頻流,并在沒有明確指令的情況下及時輸出反饋。

為了攻克這些難題,蘋果公司與復(fù)旦大學(xué)的研究團隊共同開發(fā)了StreamBridge框架。該框架通過創(chuàng)新的內(nèi)存緩沖區(qū)和輪次衰減壓縮策略,實現(xiàn)了長上下文交互的支持。這一特性使得模型能夠更有效地處理連續(xù)的視頻流信息。

StreamBridge框架還引入了一個輕量化的獨立激活模型,該模型能夠無縫集成到現(xiàn)有的視頻大語言模型中,從而賦予模型主動響應(yīng)的能力。研究團隊還精心打造了一個名為Stream-IT的數(shù)據(jù)集,該數(shù)據(jù)集包含約60萬個樣本,融合了視頻與文本序列,并支持多樣化的指令格式。Stream-IT數(shù)據(jù)集的推出,旨在進一步提升流式視頻的理解能力。

為了驗證StreamBridge框架的有效性,研究團隊在主流離線模型上進行了測試,包括LLaVA-OV-7B、Qwen2-VL-7B和Oryx-1.5-7B等。測試結(jié)果顯示,Qwen2-VL在OVO-Bench和Streaming-Bench上的平均分分別提升至71.30和77.04,這一成績甚至超越了GPT-4o和Gemini 1.5 Pro等專有模型。Oryx-1.5也取得了顯著的進步,而LLaVA-OV的性能雖然略有下降,但經(jīng)過Stream-IT數(shù)據(jù)集的微調(diào)后,所有模型的表現(xiàn)都得到了進一步的提升。

 
 
更多>同類內(nèi)容
推薦圖文
推薦內(nèi)容
點擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數(shù)碼群

主站蜘蛛池模板: av在线天堂网 | 亚洲最大成人网色 | 亚亚洲乱码一二三四区 | 亚洲电影网址 | 日本视频在线免费看 | 亚洲人成影视 | 国产成人综合久久精品亚洲 | 国产伦精品一区二区三区免费迷 | 成人四虎| 九月婷婷开心九月 | 亚洲欧美综合一区 | 亚洲国产精品午夜电影 | 久久国产精品99久久小说 | 五月天婷婷爱 | 欧美成人久久一级c片免费 久久免费视频1 | 亚洲精品播放 | 自拍偷拍网站 | 亚洲综合一区二区精品久久 | 四虎免费网址 | 亚洲毛片免费看 | 欧美日韩亚洲视频 | 小草影视在线观看 | 人人爱人人射 | 国产精品黄在线观看免费 | 亚洲国产成人精品电影 | 久九九久福利精品视频视频 | 亚洲综合激情九月婷婷 | 开心婷婷丁香 | 婷婷四房综合激情五月在线 | 五月婷婷在线观看 | 国产一区二区三区乱码网站 | 亚洲一级片在线观看 | 阿v天堂久久 | 中文字幕精品1在线 | 亚洲福利视频网址 | 羞羞影院体验区 | 亚洲国产日本 | 国产欧美网站 | 亚洲一级理论片 | 亚洲一级生活片 | 九色视频网站 |