近期,字節(jié)跳動(dòng)旗下火山引擎于杭州成功舉辦AI創(chuàng)新巡展,會(huì)上,火山引擎總裁譚待隆重揭曉了豆包1.5深度思考模型這一最新研發(fā)成果。
豆包1.5深度思考模型在多個(gè)領(lǐng)域展現(xiàn)出了卓越的能力,特別是在數(shù)學(xué)、編程、科學(xué)推理等專業(yè)范疇,以及創(chuàng)意寫作等通用任務(wù)中,其表現(xiàn)尤為亮眼。該模型采用了先進(jìn)的MoE架構(gòu),總參數(shù)高達(dá)200B,但激活參數(shù)僅為20B,相較于業(yè)界同類模型,其參數(shù)規(guī)模降低了50%,從而在推理成本上具備了顯著優(yōu)勢(shì)。
譚待在演講中深入闡述了豆包1.5深度思考模型的各項(xiàng)強(qiáng)大功能。他指出,該模型能夠與視覺(jué)理解技術(shù)緊密結(jié)合,為用戶提供多樣化的服務(wù)。例如,用戶可以通過(guò)照片分析地貌特征,或在旅行時(shí)利用該模型輔助點(diǎn)餐,甚至在企業(yè)項(xiàng)目管理中,豆包1.5也能幫助繪制流程圖。
火山引擎還對(duì)豆包文生圖模型進(jìn)行了全面升級(jí),推出了3.0版本。新版本在文字排版上更加美觀,圖片生成能力更為精細(xì),且支持直接輸出2K分辨率的圖片,為用戶帶來(lái)了更為出色的使用體驗(yàn)。
值得注意的是,豆包新模型在視頻搜索領(lǐng)域也實(shí)現(xiàn)了突破。用戶只需輸入搜索問(wèn)題,模型便能在視頻中精準(zhǔn)定位并提取出相應(yīng)答案,極大地提升了視頻搜索的效率和準(zhǔn)確性。
譚待還透露,豆包大模型的使用量正持續(xù)高速增長(zhǎng)。截至2025年3月,豆包大模型的日均tokens使用量已超過(guò)12.7萬(wàn)億,與發(fā)布之初相比,增長(zhǎng)了驚人的106倍。這一數(shù)據(jù)不僅彰顯了豆包大模型的強(qiáng)大吸引力,也預(yù)示著AI技術(shù)在未來(lái)具有廣闊的發(fā)展前景。