国产98在线 | 传媒麻豆,久久―日本道色综合久久,久久久精品久久久久久久久久久,国产成人精品免费久久久久,五月综合色婷婷影院在线观看,久久久亚洲精品视频

  • 虎科技 - 領先的互聯網科技媒體

Hugging Face發布超輕量級AI視覺語言模型,2.56億參數挑戰算力極限

   時間:2025-01-24 12:24 來源:ITBEAR作者:朱天宇

Hugging Face平臺近日宣布了一項重大進展,推出了兩款專為算力受限設備設計的輕量級AI模型——SmolVLM-256M-Instruct與SmolVLM-500M-Instruct。這兩款模型的問世,標志著在資源有限的環境下,AI性能發揮將邁入新階段。

早在去年11月,Hugging Face就已推出了僅有20億參數的SmolVLM AI視覺語言模型,該模型因其極低的內存占用而在同類產品中表現突出,特別適用于設備端推理。而此次推出的新版本,則在參數數量上進行了進一步優化。

SmolVLM-256M-Instruct,作為目前發布的最小視覺語言模型,其參數量僅為2.56億。令人驚嘆的是,這款模型甚至能在內存低于1GB的PC上流暢運行,同時提供出色的性能表現。這無疑為那些擁有有限硬件資源的用戶和開發者打開了全新的可能性。

另一款模型SmolVLM-500M-Instruct,則擁有5億參數。它主要針對硬件資源受限的場景設計,旨在幫助開發者應對大規模數據分析的挑戰,實現AI處理效率和可訪問性的雙重突破。這兩款模型的推出,無疑將進一步提升Hugging Face在AI領域的競爭力。

SmolVLM系列模型具備先進的多模態能力,能夠執行包括圖像描述、短視頻分析以及回答關于PDF或科學圖表問題在內的多項任務。Hugging Face解釋稱,SmolVLM在構建可搜索數據庫時速度更快、成本更低,其性能甚至可媲美規模遠超其自身的模型。

為了開發這些模型,Hugging Face采用了兩個專有數據集:The Cauldron和Docmatix。The Cauldron是一個包含50個高質量圖像和文本數據集的精選集合,專注于多模態學習。而Docmatix則專為文檔理解而設計,通過將掃描文件與詳細標題配對,以增強模型的理解能力。

在模型架構方面,SmolVLM-256M-Instruct和SmolVLM-500M-Instruct采用了更小的視覺編碼器SigLIP base patch-16/512,而非SmolVLM 2B中使用的更大版本SigLIP 400M SO。這一優化減少了冗余,提高了模型處理復雜數據的能力,并優化了圖像標記的處理方式。

SmolVLM系列模型能夠以每個標記4096像素的速率對圖像進行編碼,這一性能相較于早期版本中的每標記1820像素有了顯著提升。這一改進將進一步增強模型在圖像處理和理解方面的能力。

 
 
更多>同類內容
推薦圖文
推薦內容
點擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數碼群

主站蜘蛛池模板: 日韩成人免费在线 | 日本视频免费在线播放 | 丁香婷婷色综合 | 亚洲精品久 | porn精品国产| 亚洲欧美一区二区视频 | 五月亭亭激情五月 | 丁香六月综合激情 | 久久久99精品久久久久久 | 亚洲国产欧美精品一区二区三区 | 国产一区二区三区久久精品 | 亚洲欧美自拍视频 | 亚洲视频在线观看免费视频 | 亚洲精品自拍 | 久久精品播放 | 九九视频高清视频免费观看 | 欧美日韩亚洲国产 | 成人欧美一区二区三区视频不卡 | 欧美精品在线视频观看 | 久久精品成人一区二区三区 | 在线观看男女 | 成人四虎影院 | 四虎免费影院ww4164h | 亚洲自偷自拍另类小说 | 一色桃子在线精品播放 | 久久国产经典视频 | 久久精品波多野结衣 | 久久久免费精品 | 综合亚洲欧美日韩一区二区 | 男人天堂导航 | 性视频网址 | 五月婷婷视频在线观看 | 久久综合丁香 | 中文毛片 | 聚会的目的4韩语中文字 | 在线成人国产 | 日韩一区二区国色天香 | 欧美激情精品久久久久久久九九九 | 亚洲免费观看视频 | 午夜视频免费国产在线 | 亚洲欧洲日韩另类自拍 |