国产98在线 | 传媒麻豆,久久―日本道色综合久久,久久久精品久久久久久久久久久,国产成人精品免费久久久久,五月综合色婷婷影院在线观看,久久久亚洲精品视频

  • 虎科技 - 領先的互聯網科技媒體

Token-Shuffle突破!自回歸模型也能高效生成高清圖像

   時間:2025-04-26 15:05 來源:ITBEAR作者:楊凌霄

近日,科技新聞界傳來一則關于meta AI創新進展的報道。據報道,meta AI研發了一種名為Token-Shuffle的新方法,旨在解決自回歸(AR)模型在生成高分辨率圖像時所面臨的挑戰。

自回歸模型是一種在時間序列分析中廣泛應用的統計方法,它基于歷史數據預測未來值。近年來,這種方法在語言生成領域取得了顯著成就,并逐漸應用于圖像合成。然而,在處理高分辨率圖像時,AR模型遇到了瓶頸。與文本生成相比,圖像合成需要處理數千個token,導致計算成本急劇增加,限制了AR模型在精細圖像生成中的應用。

盡管擴散模型在高分辨率圖像生成方面表現出色,但其復雜的采樣過程和較慢的推理速度也成為其應用的局限。因此,meta AI推出的Token-Shuffle方法顯得尤為重要。

Token-Shuffle的核心機制在于解決token效率問題。該方法通過識別多模態大語言模型(MLLMs)中視覺詞匯的維度冗余,提出了一種創新策略:在Transformer處理前,將空間上相鄰的視覺token沿通道維度合并,推理后再恢復原始空間結構。這種token融合機制不僅降低了計算成本,還保持了視覺質量,使自回歸模型能夠高效處理最高達2048×2048分辨率的圖像。

具體來說,Token-Shuffle包括兩個關鍵步驟:token-shuffle和token-unshuffle。在輸入準備階段,通過多層感知機(MLP)將空間相鄰的token壓縮為單個token,從而減少token數量。以窗口大小s為例,token數量可減少到原來的s2分之一,顯著降低了Transformer的計算量。

Token-Shuffle還引入了針對自回歸生成的classifier-free guidance(CFG)調度器,動態調整引導強度,優化文本-圖像對齊效果。這一創新不僅提升了圖像生成的質量,還為AR模型在高分辨率圖像生成領域樹立了新的標桿。

在實驗中,Token-Shuffle展現了強大的實力。在GenAI-Bench基準測試中,基于2.7B參數的LLaMA模型,Token-Shuffle在“困難”提示下取得了VQAScore 0.77,超越了其他AR模型如LlamaGen和擴散模型LDM。同時,在Geneval基準測試中,Token-Shuffle的綜合得分為0.62,為AR模型樹立了新的標準。

用戶評估也顯示,盡管在邏輯一致性方面略遜于擴散模型,但Token-Shuffle在文本對齊和圖像質量上優于LlamaGen和Lumina-mGPT。這一成果不僅為圖像合成領域帶來了新的突破,也為未來AR模型在更高分辨率圖像生成中的應用提供了可能。

 
 
更多>同類內容
推薦圖文
推薦內容
點擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數碼群

主站蜘蛛池模板: 五月开心六月伊人色婷婷 | 最新国产福利 | 久久精品国产在热久久2019 | 亚洲免费三区 | 亚洲日本视频在线 | 亚洲视频入口 | 99资源在线| 国产精品视频视频久久 | 男女男精品视频 | 最近免费中文完整视频观看 | 久久久久国产成人精品亚洲午夜 | 国产黄网站| 免费大学生国产在线观看p 亚洲欧美自拍偷拍 | 国产97公开成人免费视频 | 午夜视频国产 | 久久综合久久综合久久综合 | 九月婷婷丁香 | 一级国产精品一级国产精品片 | 伊人久久五月天综合网 | 男人天堂a在线 | 亚州综合激情另类久久久 | 午夜在线一区 | 深爱五月网| 亚洲日韩精品欧美一区二区 | 国色天香社区在线观看免费播放 | 欧美久久一区二区 | 国色天香社区在线观看免费播放 | 免费的黄网站男人的天堂 | 亚洲人免费视频 | 伊人五月在线 | 国产一区二区三区精品久久呦 | 六月丁香婷婷色狠狠久久 | 国产一二三四区在线观看 | 精品国产欧美一区二区三区成人 | 国产在线观看一区 | 亚洲成人伊人网 | 亚洲视频欧洲视频 | 一级欧美日韩 | 久久国产精品一区 | 久久精品综合一区二区三区 | 波多野结衣在线高清 |