国产98在线 | 传媒麻豆,久久―日本道色综合久久,久久久精品久久久久久久久久久,国产成人精品免费久久久久,五月综合色婷婷影院在线观看,久久久亚洲精品视频

  • 虎科技 - 領(lǐng)先的互聯(lián)網(wǎng)科技媒體

AI推理模型受熱捧,基準(zhǔn)測試費用為何水漲船高?

   時間:2025-04-13 11:15 來源:ITBEAR作者:陸辰風(fēng)

隨著人工智能技術(shù)日新月異的發(fā)展,推理AI模型逐漸成為了科研領(lǐng)域的熱門焦點。這類模型能夠模擬人類的思考過程,尤其在物理學(xué)等專業(yè)領(lǐng)域,展現(xiàn)出了超越非推理模型的卓越能力。然而,高昂的測試成本卻成為了驗證這些模型性能的一大障礙。

據(jù)第三方AI測試機構(gòu)“人工智能分析”提供的數(shù)據(jù),評估不同推理模型的費用差異顯著。以O(shè)penAI的o1推理模型為例,在七個主流的AI基準(zhǔn)測試中的評估費用高達(dá)2767.05美元,折合人民幣約20191元。相比之下,Anthropic的Claude 3.7 Sonnet混合推理模型的評估費用為1485.35美元,折合人民幣約10839元。而OpenAI的o3-mini-high模型評估則僅需344.59美元,折合人民幣約2514元。盡管存在費用較低的模型,如OpenAI的o1-mini評估費用僅為141.22美元,折合人民幣約1030元,但整體來看,推理模型的測試成本依然偏高。

“人工智能分析”機構(gòu)已投入約5200美元,折合人民幣約37945元,用于評估十幾種推理模型,這一投入幾乎是非推理模型評估費用2400美元的兩倍。OpenAI在2024年5月發(fā)布的非推理GPT-4o模型評估成本僅為108.85美元,而Claude 3.6 Sonnet的評估成本更是低至81.41美元。該機構(gòu)的聯(lián)合創(chuàng)始人喬治·卡梅倫表示,隨著推理模型的開發(fā)日益增多,測試預(yù)算也將相應(yīng)增加。

AI初創(chuàng)公司“通用推理”的首席執(zhí)行官羅斯·泰勒也面臨著測試成本上升的挑戰(zhàn)。他透露,為評估Claude 3.7 Sonnet,使用了約3700個獨特的提示詞,費用高達(dá)580美元。泰勒估計,僅對MMLU Pro進行一次完整測試的成本就可能超過1800美元。他擔(dān)憂地指出,隨著資源投入的差異,學(xué)者可能無法復(fù)制實驗室的報告結(jié)果。

推理模型測試成本高昂的主要原因在于其生成的token數(shù)量龐大。Token是原始文本的片段,如將單詞“fantastic”拆分為多個音節(jié)。據(jù)“人工智能分析”稱,在基準(zhǔn)測試中,OpenAI的o1模型生成了超過4400萬個token,是GPT-4o生成量的八倍。由于大多數(shù)AI公司按token收費,因此成本迅速累積。

現(xiàn)代基準(zhǔn)測試包含復(fù)雜、多步驟任務(wù)的問題,導(dǎo)致模型生成大量token。Epoch AI的高級研究員讓-斯坦尼斯拉斯·德內(nèi)恩指出,盡管每個基準(zhǔn)測試的問題數(shù)量總體減少,但問題本身更加復(fù)雜,旨在評估模型執(zhí)行現(xiàn)實世界任務(wù)的能力,如編寫和執(zhí)行代碼、瀏覽互聯(lián)網(wǎng)等。最昂貴的模型每百萬輸出token的成本也在不斷增加。例如,Anthropic發(fā)布的Claude 3 Opus模型每百萬輸出token的成本為75美元,而OpenAI的GPT-4.5和o1-pro模型的成本則分別為150美元和600美元。

德內(nèi)恩表示,盡管隨著技術(shù)進步,模型的性能提升且成本有所下降,但評估最大最好的模型仍需支付高昂費用。部分AI實驗室,包括OpenAI,為測試目的向基準(zhǔn)測試組織提供免費或補貼的模型訪問權(quán)限,但一些專家擔(dān)憂這可能影響測試結(jié)果的公正性。

 
 
更多>同類內(nèi)容
推薦圖文
推薦內(nèi)容
點擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數(shù)碼群

主站蜘蛛池模板: 男女做羞羞的网站视频 | 男女视频网址 | 久久精品午夜 | 香蕉视频在线精品 | 欧美 国产 日本 | 噜噜噜噜精品视频在线观看 | 日本视频免费在线播放 | 俄罗斯三级最新电影 | 久久精品视频一区二区三区 | 亚洲精品成人久久 | 亚洲国产精品免费 | 亚洲第一区视频在线观看 | 色94色欧美一区 | 一本岛一区在线观看不卡 | 伊人网综合视频 | 亚洲高清在线观看视频 | 中文字字幕在线精品乱码app | 亚洲成人在线电影 | 性欧美激情在线观看 | 国产精品一区伦免视频播放 | 四虎网站最新地址 | 在线色网站 | 五月激情综合网 | 东方亚洲东方欧美色二区 | 综合婷婷 | 日本精品一区二区三区在线视频 | 欧美日韩综合精品一区二区三区 | 在线看片欧美 | 伊人婷婷色香五月综合缴缴情小蛇 | 高清国产精品久久 | 自拍偷拍小视频 | 免费观看激色视频网站(性色) | 性做久久久久久蜜桃花 | 九号影院 | 男人的午夜天堂 | 精品久久久久不卡无毒 | 亚洲永久免费视频 | 国产精品视频免费看 | 亚洲高清在线观看 | www.sese五月天 | 伊在人亚洲香蕉精品区麻豆 |