国产98在线 | 传媒麻豆,久久―日本道色综合久久,久久久精品久久久久久久久久久,国产成人精品免费久久久久,五月综合色婷婷影院在线观看,久久久亚洲精品视频

  • 虎科技 - 領(lǐng)先的互聯(lián)網(wǎng)科技媒體

微軟開源OmniParser,GPT-4V秒解析屏幕截圖,智能新突破!

   時間:2024-10-29 10:38 來源:ITBEAR作者:楊凌霄

微軟近日宣布了一項重大開源項目——OmniParser,這是一款專為解析和識別屏幕上可交互圖標(biāo)設(shè)計的AI工具。傳統(tǒng)自動化方法受限于HTML或視圖層次結(jié)構(gòu),而現(xiàn)有的視覺語言模型在處理復(fù)雜GUI元素時又顯得力不從心。為此,微軟推出了這款純視覺基礎(chǔ)的工具,旨在解決當(dāng)前屏幕解析技術(shù)的局限性。

OmniParser結(jié)合了可交互區(qū)域檢測模型、圖標(biāo)描述模型和OCR模塊,無需依賴HTML標(biāo)簽或視圖層次結(jié)構(gòu)等顯式基礎(chǔ)數(shù)據(jù)。這一特性使得它能夠在桌面、移動設(shè)備和網(wǎng)頁等多種平臺上跨平臺工作,顯著提高了用戶界面的解析準(zhǔn)確性。OmniParser還能將識別出的屏幕元素轉(zhuǎn)換成結(jié)構(gòu)化的數(shù)據(jù)。

在實際測試中,OmniParser展現(xiàn)出了卓越的性能。在ScreenSpot數(shù)據(jù)集中,它的準(zhǔn)確率提高了73%,遠超依賴HTML解析的模型。同時,當(dāng)GPT-4V使用OmniParser的輸出后,圖標(biāo)的正確標(biāo)記率從70.5%提升至93.8%。這些改進充分證明了OmniParser在解決當(dāng)前GUI交互模型根本缺陷方面的有效性。

微軟已在Hugging Face上發(fā)布了OmniParser,這一舉措將有助于普及這一前沿技術(shù),進一步推動多模態(tài)AI的發(fā)展,特別是在無障礙、自動化和智能用戶輔助等領(lǐng)域。

 
 
更多>同類內(nèi)容
推薦圖文
推薦內(nèi)容
點擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數(shù)碼群

主站蜘蛛池模板: 欧美日韩无| 亚洲精品电影院 | 亚洲视频网站在线观看 | 亲热网站 | 亚洲人成一区二区三区 | 一级爱做片免费观看久久 | 欧美乱妇高清无乱码在线观看 | 亚洲一区二区三区高清视频 | 亚洲高清美女一区二区三区 | 一道本一区二区三区 | 男人的天堂精品国产一区 | 欧美在线日韩 | 在线免费小视频 | 亚洲五月七月丁香缴情 | 日本强在线播放一区 | 久久亚洲不卡一区二区 | 狠狠干五月天 | 香蕉青草久久成人网 | 2021国产麻豆剧传媒剧情 | 四虎精品成人免费观看 | 亚洲一区二区三区高清视频 | 一级片在线免费观看 | 五色影院 | 五月婷婷六月激情 | 久久国产综合精品欧美 | 国产久热香蕉在线观看 | 国产成人一区二区三区视频免费蜜 | 色精品视频 | 香蕉视频97 | 亚洲欧美精品一中文字幕 | 亚洲男人的天堂久久精品 | 羞羞网页 | 亚洲国产精品一区二区九九 | 亚洲高清中文字幕精品不卡 | 亚洲国产精品一区二区第四页 | 亚洲国产欧美在线 | 人人狠狠综合久久亚洲 | 欧美久久精品 | 欧美 日韩 成人 | 亚洲欧美日韩国产精品久久 | 波多野结在线 |