在編程領域的最新突破中,阿里巴巴開源了其通義千問系列中的全新AI編程大模型——Qwen3-Coder。這一模型的問世,標志著開源編程模型在能力上實現了飛躍,不僅超越了諸如GPT4.1等閉源模型,更與全球頂尖的編程模型Claude4比肩而立。
Qwen3-Coder作為千問系列中的首個混合專家MoE架構代碼模型,其參數規模龐大,總計達到4800億,其中激活參數為350億。這一模型原生支持256K token的上下文長度,且具備擴展至1M長度的能力,為用戶提供了廣闊的操作空間。
在預訓練階段,Qwen3-Coder使用了代碼占比高達70%的7.5T數據,并通過強化學習在編程任務及智能體任務上進行了后訓練。這一訓練策略顯著提升了模型的通用能力、代碼能力以及Agent能力。在WebArena和BFCL等評測中,Qwen3-Coder刷新了開源模型的紀錄,超越了GPT4.1。而在SWE-Bench評測中,該模型同樣表現出色,取得了開源模型中的最佳效果,與Claude4不相上下。
Qwen3-Coder憑借其卓越的Agent能力,在解決多步驟長任務時展現出強大的實力。它能夠全局規劃工作內容,自主調用各種工具進行深入鉆研,最終解決復雜的編程任務。這一能力使得網頁開發、AI搜索、深度研究等智能體應用變得更加智能和高效。實測數據顯示,在執行任務時,Qwen3-Coder調用的工具數量遠超Claude,效果令人矚目。
對于程序員而言,Qwen3-Coder無疑是一款強大的助手。它能夠輕松完成基礎編程任務,如寫代碼、補全代碼、修復Bug等,顯著提升編程工作效率。代碼測試、查詢生成等工作在Qwen3-Coder的幫助下,從人工編寫的數小時縮短至數分鐘。該模型還降低了普通人入門編程的門檻,讓AI氛圍編程成為現實,用戶只需一句話就能生成精妙復雜的3D物理模擬過程。
目前,Qwen3-Coder已在魔搭社區和HuggingFace等平臺開源,全球開發者可免費下載使用。同時,該模型即將接入阿里巴巴的AI編程產品通義靈碼,其API也已上線阿里云百煉。為了方便開發者更好地利用Qwen3-Coder,通義團隊還開源了一款命令行工具Qwen Code。Qwen3-Coder的API可以與Claude Code、Cline等工具協同使用,為用戶提供更多樣化的編程體驗。
千問系列編程模型自推出以來,便受到了全球開發者的熱烈歡迎。截至目前,其全球下載量已突破2000萬次,成為最受歡迎的開源編程模型之一。阿里巴巴內部也已開始大量使用AI編程技術,一汽集團、中國石油、建設銀行、平安集團、南方航空、小鵬汽車等行業頭部企業也紛紛接入千問AI編程模型,共同推動編程技術的創新與發展。