近期,隨著一年一度的高考英語科目圓滿落幕,英語作文題目再度激發了社會各界的熱烈討論。令人矚目的是,今年不僅有真實的考生參與,還有六款深度推理大模型作為“特別考生”,一同參與了這場作文挑戰。
在這場別開生面的測試中,各個大模型需要扮演紅星中學高三學生李華的角色,就聯合國倡議征集活動的建議,給外國好友Jim回復一封郵件。參與的大模型包括DeepSeek R1、ChatGPT o3、通義千問Qwen3、騰訊混元T1、訊飛星火X1以及百度文心X1。在關閉網絡搜索功能后,這些大模型憑借深度思考模式,開始了各自的創作。
在諸多大模型的作文中,訊飛星火X1的表現尤為亮眼。其作文不僅立意新穎,而且用詞精準高級,獲得了兩位資深英語教師的極高評價。北京市十一學校一分校的英語老師韓憲昌和深圳中學的英語教師趙文嘉,分別給予了訊飛星火X1內容8分、語言8分、結構4分,總分20分,以及19分的高分。綜合兩位教師的評分,訊飛星火X1的平均得分位居首位,充分證明了其在英語寫作方面的強大實力。
訊飛星火X1之所以能在眾多競爭者中拔得頭籌,關鍵在于其內容的完整性和語言的準確性。其作文在審題、句式多樣性、邏輯清晰度以及理由的充分性方面,均展現出了卓越的水平。訊飛星火X1在4月20日完成的一次全新升級,也對其在本次測評中的出色表現起到了積極作用。盡管其模型參數相比業界同類模型小了一個數量級,但整體效果已經可以與OpenAI o1和DeepSeek R1相媲美,且在邏輯推理、文本生成和語言理解等能力上有了顯著提升。