久久精品视频亚洲,久久一区二区三区精品,久99频这里只精品23热视频

OpenAI新模型o3與o4-mini：大模型與Agent融合的新里程碑？

時間：2025-04-23 12:39 來源：ITBEAR作者：顧雨柔

奧特曼公司在科技界的又一次重大動作引發了廣泛關注。近日，該公司宣布推出兩款全新的o系列模型——滿血版o3和o4-mini，這兩款模型不僅性能強勁，而且能夠無縫集成ChatGPT中的多種工具，涵蓋圖像生成、圖像分析、文件解釋、網絡搜索以及Python編程等多個領域。

據奧特曼公司介紹，這兩款新模型相較于前代產品，在性能上有了顯著提升，同時價格更加親民。消息一經發布，立即引發了科技愛好者的熱烈討論和測試。

網友們紛紛曬出了對新模型的測試結果，其中“小球測試”的結果尤為引人注目。一位網友表示：“這是我迄今為止看到的最好的測試結果，o3和o4-mini的表現確實令人驚嘆。”在HLM基準測試中，這兩款新模型也迅速攀升至榜單前三，其強大的性能讓業內人士和網友們大呼震驚。

從官方數據來看，o3在多個基準測試中刷新了紀錄，包括Codeforces、SWE-bench和MMMU等。在應對復雜現實任務時，o3相比OpenAI o1減少了20%的重大錯誤，尤其在編程、商業咨詢和創意構思方面表現出色。而o4-mini雖然體積小巧，但專為快速、高效的推理任務而設計，支持更高的使用頻率。在數學、編程和視覺任務上，o4-mini同樣表現出色，在2025年AIME數學競賽中，借助Python解釋器的幫助，取得了接近滿分的優異成績。

o3和o4-mini首次實現了將圖像直接融入思維鏈的能力。它們不僅能夠“看見”圖像，更能“通過圖像思考”，這一創新帶來了視覺與文本推理的全新融合方式，顯著提升了模型在多模態任務中的表現。OpenAI圖像推理研究員Jiahui Yu表示：“自o系列推出以來，‘圖像思考’始終是我們感知領域的核心戰略之一。如今，隨著o3和o4-mini的發布，這一戰略終于以更為成熟和完整的形式落地。”

這兩款新模型能夠自由調用ChatGPT中的各種工具，這一能力讓模型從“聰明大腦”進化為“靈巧雙手”。網友們紛紛嘗試利用這一新功能，發現模型能夠輕松完成跨工具的任務，帶來了前所未有的便捷體驗。OpenAI首席研究官Mark Chen表示：“一旦推理模型學會了端到端地使用工具，它們就會變得更加強大。最新的o系列模型正是我們向未來邁出的重要一步。”

除了新模型的發布，奧特曼公司還開源了一款本地代碼智能體——Codex CLI。這款輕量級的編碼助手能夠直接在用戶的終端命令行中運行，充分發揮o3、o4-mini等模型的推理能力，緊密連接本地開發環境。未來，Codex CLI還將支持GPT 4.1等其他模型，為開發者提供更加便捷、高效的編碼體驗。Codex CLI甚至支持通過截圖或手繪草圖進行多模態編程，這一創新功能刷新了代碼交互與內容理解的邊界。

更多>同類內容

三星新機動態：Galaxy A07 4G認證完成，S25	三星Galaxy A07 4G獲多項認證，Galaxy S25
iPhone 17 Pro或將采用全新天線設計：環繞	榮耀萬毫安新機搭載天璣8500，紅米K90設計

国产98在线 | 传媒麻豆,久久―日本道色综合久久,久久久精品久久久久久久久久久,国产成人精品免费久久久久,五月综合色婷婷影院在线观看,久久久亚洲精品视频

OpenAI新模型o3與o4-mini：大模型與Agent融合的新里程碑？