国产98在线 | 传媒麻豆,久久―日本道色综合久久,久久久精品久久久久久久久久久,国产成人精品免费久久久久,五月综合色婷婷影院在线观看,久久久亚洲精品视频

  • 虎科技 - 領(lǐng)先的互聯(lián)網(wǎng)科技媒體

{中美AI“考生”東大入學(xué)考:英語超群數(shù)學(xué)短板,能否預(yù)示AI未來?)

   時間:2025-04-07 13:04 來源:ITBEAR作者:陸辰風(fēng)

近期,據(jù)日經(jīng)新聞披露的一項聯(lián)合研究成果顯示,中美兩國的新型生成式人工智能(AI)已經(jīng)展現(xiàn)出令人矚目的學(xué)術(shù)能力,成功跨越了日本頂尖學(xué)府——東京大學(xué)理科3類入學(xué)考試的門檻。這一突破性進(jìn)展是通過對比測試美國OpenAI的“o1”模型與中國AI初創(chuàng)企業(yè)DeepSeek的“R1”模型得出的。

測試內(nèi)容涵蓋了2025年度的東京大學(xué)入學(xué)考試科目,由AI初創(chuàng)公司Life Prompt提供答案輸出,并由知名預(yù)備學(xué)校河合塾的專業(yè)講師進(jìn)行評分。結(jié)果顯示,在兩個基礎(chǔ)模型的表現(xiàn)中,o1獲得了374分,R1緊隨其后,取得了369分,均超過了東大理科3類合格的最低分?jǐn)?shù)線368.7分。

值得注意的是,盡管R1在理科1類和理科2類的共通考試中未能達(dá)到合格線,但在其他類別,包括文科在內(nèi),它與o1均成功“合格”。這一表現(xiàn)不僅展示了AI在跨學(xué)科應(yīng)用上的潛力,也反映了其在學(xué)術(shù)評估中的廣泛適用性。

在具體的考試科目中,英語成為了AI模型的強(qiáng)項。o1和R1在英語部分的得分率均超過了75%,河合塾的英語講師久恒秀雄對此評價道:“這兩個模型在英語表達(dá)上幾乎沒有單詞和語法的錯誤,其水平遠(yuǎn)遠(yuǎn)超過了東大考生的平均水平?!?/p>

然而,在數(shù)學(xué)科目上,盡管AI模型能夠正確解答出不少最終答案,但在圖形處理和論證問題上卻頻繁出現(xiàn)論述錯誤和說明不足的情況。在滿分為120分的理科數(shù)學(xué)考試中,o1得了38分,R1得了49分,這一成績顯著低于合格者的平均分。負(fù)責(zé)數(shù)學(xué)評分的香坂季京講師指出:“AI在數(shù)學(xué)論證上的表現(xiàn)還有待提高?!?/p>

對于這一研究成果,自2011年起便致力于“機(jī)器人能否進(jìn)入東京大學(xué)”項目的國立信息學(xué)研究所新井紀(jì)子教授給予了高度評價:“這是AI成長歷程中的一個重要里程碑。然而,我們也必須認(rèn)識到,AI有時會給出令人困惑甚至錯誤的答案。因此,培養(yǎng)能夠正確判斷并熟練使用AI輸出的人才顯得尤為重要?!?/p>

 
 
更多>同類內(nèi)容
推薦圖文
推薦內(nèi)容
點擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數(shù)碼群

主站蜘蛛池模板: 久久久久久久国产精品视频 | 性爽交免费视频 | 欧美日韩一区二区三区视频 | 六月丁香在线观看 | 亚洲人成一区二区不卡 | 成人欧美一区二区三区黑人免费 | 免费在线一区二区三区 | 免费日韩精品 | 欧美视频在线播放观看免费福利资源 | 日韩在线欧美在线 | 性色老女人| 日韩午夜网站 | 国产欧美日韩一区二区三区 | 亚洲高清免费在线观看 | 亚洲国产精品一区二区三区 | 一区二区三区久久 | 亚洲国产欧美自拍 | 亚洲精品电影院 | 国产高清黄色 | 2021日韩麻豆 | 国产综合色在线视频播放线视 | 五月婷婷综合激情 | 欧美精品v国产精品v日韩精品 | 女人的天堂网站 | 伊人久久婷婷 | 一级欧美 | 亚洲五月丁香综合视频 | 久久综合精品国产一区二区三区 | 国产成人一区二区三区 | 国产97在线观看 | 国产亚洲欧美一区二区三区 | 男人天堂色男人 | 羞羞视频免费观看入口 | 伊人网在线免费观看 | 免费一区在线观看 | 精品免费视频 | 亚洲国产天堂在线观看 | 国产精品久久久久久免费 | 香蕉综合视频 | 亚洲欧洲精品成人久久曰 | 高清国产性色视频在线 |