奧特曼公司在科技界的又一次重大動作引發了廣泛關注。近日,該公司宣布推出兩款全新的o系列模型——滿血版o3和o4-mini,這兩款模型不僅性能強勁,而且能夠無縫集成ChatGPT中的多種工具,涵蓋圖像生成、圖像分析、文件解釋、網絡搜索以及Python編程等多個領域。
據奧特曼公司介紹,這兩款新模型相較于前代產品,在性能上有了顯著提升,同時價格更加親民。消息一經發布,立即引發了科技愛好者的熱烈討論和測試。
網友們紛紛曬出了對新模型的測試結果,其中“小球測試”的結果尤為引人注目。一位網友表示:“這是我迄今為止看到的最好的測試結果,o3和o4-mini的表現確實令人驚嘆?!痹贖LM基準測試中,這兩款新模型也迅速攀升至榜單前三,其強大的性能讓業內人士和網友們大呼震驚。
從官方數據來看,o3在多個基準測試中刷新了紀錄,包括Codeforces、SWE-bench和MMMU等。在應對復雜現實任務時,o3相比OpenAI o1減少了20%的重大錯誤,尤其在編程、商業咨詢和創意構思方面表現出色。而o4-mini雖然體積小巧,但專為快速、高效的推理任務而設計,支持更高的使用頻率。在數學、編程和視覺任務上,o4-mini同樣表現出色,在2025年AIME數學競賽中,借助Python解釋器的幫助,取得了接近滿分的優異成績。
o3和o4-mini首次實現了將圖像直接融入思維鏈的能力。它們不僅能夠“看見”圖像,更能“通過圖像思考”,這一創新帶來了視覺與文本推理的全新融合方式,顯著提升了模型在多模態任務中的表現。OpenAI圖像推理研究員Jiahui Yu表示:“自o系列推出以來,‘圖像思考’始終是我們感知領域的核心戰略之一。如今,隨著o3和o4-mini的發布,這一戰略終于以更為成熟和完整的形式落地?!?/p>
這兩款新模型能夠自由調用ChatGPT中的各種工具,這一能力讓模型從“聰明大腦”進化為“靈巧雙手”。網友們紛紛嘗試利用這一新功能,發現模型能夠輕松完成跨工具的任務,帶來了前所未有的便捷體驗。OpenAI首席研究官Mark Chen表示:“一旦推理模型學會了端到端地使用工具,它們就會變得更加強大。最新的o系列模型正是我們向未來邁出的重要一步?!?/p>
除了新模型的發布,奧特曼公司還開源了一款本地代碼智能體——Codex CLI。這款輕量級的編碼助手能夠直接在用戶的終端命令行中運行,充分發揮o3、o4-mini等模型的推理能力,緊密連接本地開發環境。未來,Codex CLI還將支持GPT 4.1等其他模型,為開發者提供更加便捷、高效的編碼體驗。Codex CLI甚至支持通過截圖或手繪草圖進行多模態編程,這一創新功能刷新了代碼交互與內容理解的邊界。