OpenAI在沉寂六年后,終于重返開源領(lǐng)域,近期震撼發(fā)布了兩款全新大語言模型——gpt-oss-120b與gpt-oss-20b。這一舉動(dòng)標(biāo)志著OpenAI自2019年GPT-2之后,再次向公眾敞開了其技術(shù)的大門,盡管近年來它更多地聚焦于付費(fèi)專有模型的研發(fā)。
gpt-oss-120b,這款龐然大物擁有驚人的1170億總參數(shù),其中每token激活51億參數(shù),專為高推理能力的生產(chǎn)級和通用場景量身打造。它能夠在單塊配備80GB顯存的英偉達(dá)H100 GPU上流暢運(yùn)行,展現(xiàn)了強(qiáng)大的處理能力和效率。而gpt-oss-20b,雖然規(guī)模稍小,總參數(shù)達(dá)到210億,每token激活36億參數(shù),但它卻以低延遲和本地化設(shè)計(jì)為亮點(diǎn),僅需16GB內(nèi)存便能在邊緣設(shè)備,如家用筆記本電腦或臺式機(jī)上輕松運(yùn)行,極大地拓寬了應(yīng)用場景。
這兩款模型均為純文本語言模型,它們在文本處理、代碼生成以及數(shù)學(xué)問題求解等領(lǐng)域展現(xiàn)出了非凡的實(shí)力。更令人興奮的是,gpt-oss系列采用了Apache 2.0許可協(xié)議,這意味著無論是個(gè)人用戶、開發(fā)者還是企業(yè),都可以免費(fèi)下載這些模型,并根據(jù)自身需求進(jìn)行參數(shù)級的微調(diào),以適應(yīng)特定的應(yīng)用場景。更重要的是,這些調(diào)整后的模型還可以用于商業(yè)服務(wù)或創(chuàng)收,而無需向OpenAI支付任何費(fèi)用,這與國內(nèi)如DeepSeek、Qwen 3等開源模型的做法不謀而合。