在科技界的矚目之下,阿里巴巴于近日震撼宣布,其傾力打造的新一代通義千問大模型Qwen3(簡稱千問3)已正式向全球開源,這一舉動不僅標志著中國在AI領(lǐng)域的重大突破,也讓千問3一躍成為全球最強的開源模型。
更令人驚嘆的是,千問3在性能和成本控制上實現(xiàn)了質(zhì)的飛躍。它以DeepSeek-R1三分之一的參數(shù)規(guī)模,卻全面超越了其性能。在代碼生成、數(shù)學推理以及通用能力等基準測試中,千問3均刷新了全球開源模型的記錄,同時訓練和部署成本大幅降低。
千問3的三大核心優(yōu)勢尤為突出:卓越的性能、低廉的成本以及全面的開源。其混合推理架構(gòu)重塑了行業(yè)標準,顯存占用僅為競品的1/3,全球用戶都能暢享AI技術(shù)的紅利。這一開源舉措,無疑將加速AI技術(shù)在全球范圍內(nèi)的普及和應(yīng)用。
在性能方面,千問3作為國內(nèi)首個實現(xiàn)混合推理的模型,深度融合了人類直覺思維與邏輯推演機制。它既能快速響應(yīng)簡單問題,又能深入推理復雜問題,這種能力在熱門模型中極為罕見。目前,僅有千問3、Claude3.7以及Gemini 2.5 Flash能夠做到這一點。混合推理的實現(xiàn),需要極其精細和創(chuàng)新的設(shè)計及訓練,千問3的成功無疑樹立了新的標桿。
千問3還構(gòu)建了覆蓋全場景的工業(yè)化模型體系,共包含8款差異化模型,滿足從邊緣計算到企業(yè)級應(yīng)用的多樣化需求。無論是旗艦級的Qwen3-235B-A22B,還是輕量化的Qwen3-30B-A3B,都能在不同的場景下發(fā)揮出色的性能。這些模型均遵循Apache 2.0開源協(xié)議,開發(fā)者可根據(jù)具體需求靈活選擇部署方案。
在成本控制方面,千問3同樣表現(xiàn)出色。僅需4張H20 GPU便能部署完整功能的千問3模型,顯存占用量僅為同類性能模型的三分之一。這一技術(shù)突破顯著降低了硬件資源需求,使得頂尖AI模型的應(yīng)用準入門檻大幅降低。以旗艦版千問3為例,其龐大的架構(gòu)僅需4張H20 GPU或同等算力設(shè)備即可流暢運行,而相比之下,滿血版DeepSeek-R1的硬件總成本高達約200萬元。
千問3的開源策略更是將AI技術(shù)推向了新的高度。全系列模型采用寬松的Apache2.0協(xié)議開源,全球開發(fā)者、研究機構(gòu)和企業(yè)均可免費下載模型并商用。這一開放舉措將加速AI技術(shù)在終端場景的規(guī)模化落地,為各行業(yè)帶來普惠性的智能升級機遇。同時,千問3還支持高達119種語言和方言,為全球各國各地區(qū)的人們提供了強大的AI技術(shù)支持。
尤其千問3的開源對于缺乏自研能力的國家和地區(qū)而言,意味著其本土語言首次獲得了強大的AI技術(shù)支持。這一舉措無疑將促進全球AI技術(shù)的均衡發(fā)展,讓更多的人享受到AI帶來的便利和福祉。