2025年春節,科技界的焦點無疑被DeepSeek搶占。這家中國的大模型創業公司,在春節期間以其V3和R1模型的發布,引發了全球科技圈的震動。
回顧過去三年,每年的春節都伴隨著一次重大的AI話題討論。2023年,ChatGPT橫空出世;2024年,Sora接力引領潮流。這兩股浪潮均由OpenAI掀起,而到了2025年,DeepSeek的V3與R1則成為了新的主角。
這一數據對比,讓包括meta在內的多家硅谷企業深感震撼,并對OpenAI過去“大力出奇跡”的成功方法論產生了質疑。這一連串的震撼甚至引發了硅谷多家科技巨頭的市值暴跌,其中英偉達一夜之間市值蒸發了4.3萬億,這相當于騰訊與美團兩家中國互聯網巨頭市值的總和。
DeepSeek的崛起,讓業界不禁聯想到美國可能會出臺的一系列制裁政策。然而,就在DeepSeek引發硅谷地震前不久,1月15日,美國剛剛將中國最早的大模型創業公司“智譜AI”列入了實體清單。在AI 1.0時代,商湯、曠視等企業也曾遭遇過類似的待遇。被列入實體清單意味著難以購買海外生產的GPU,這在短期內仍是大模型訓練升級的重要條件。然而,DeepSeek的成功卻證明了,無論美國采取何種“卡脖子”措施,都無法阻擋中國AI技術的持續創新。
事實上,在DeepSeek之前,中國的大模型已經在默默耕耘。2024年被稱為“中國大模型元年”,多家創業公司發布了眾多模型,其中不乏開源的。例如,智譜AI在一年內就發布了超過10款基座模型,覆蓋了文本、圖像、語音、視頻、代碼生成等多個領域。而階躍星辰也發布了多款模型,包括多模態大模型、圖像生成大模型等。這些模型的發布,不僅數量眾多,而且在模態、尺寸、性能上也實現了全面覆蓋。
DeepSeek的震撼之處在于,它不僅在技術上實現了突破,而且其開源的做法也打破了OpenAI等公司的閉源模式。這使得更多的中國團隊能夠參與到大模型的研發中來,推動了中國AI技術的快速發展。據不完全統計,從2024年到2025年1月,中國的大模型創業公司就發布了超過50個模型。
DeepSeek的崛起,也引發了業界對于中美AI較量的重新思考。過去,中國的大模型在技術上一直跟隨美國的步伐。然而,DeepSeek的成功卻證明了中國在大模型上的AI能力已經與美國的時間差距越來越小。這不僅體現在技術上,更體現在創新能力和市場應用上。
DeepSeek的V3和R1模型不僅在算力上實現了突破,而且在技術上也有諸多創新。例如,R1模型采用了混合專家模型(MoE)、多頭潛注意力(MLA)等設計,并進行了只采用強化學習(RL)而不進行監督微調(SFT)的訓練嘗試。這些創新使得R1在數學、代碼、自然語言推理等任務上的性能比肩OpenAI的o1正式版。
DeepSeek的成功也為中國的大模型創業公司帶來了新的機遇和挑戰。一方面,DeepSeek的開源做法使得更多的中國團隊能夠參與到大模型的研發中來,推動了中國AI技術的快速發展。另一方面,DeepSeek的崛起也引發了其他大模型公司的競爭和反思。許多公司開始重新審視自己的技術路線和商業模式,并尋求在技術和產品上的創新。
在DeepSeek的帶動下,中國的大模型創業公司紛紛加大了在技術和產品上的投入。例如,智譜AI在發布多款基座模型的同時,還開源了多款模型供業界使用。而階躍星辰也在不斷更新和升級自己的模型產品。
一些專注于C端產品應用的創業公司也開始發力大模型市場。例如,月之暗面和MiniMax都發布了多款針對C端用戶的產品。這些產品的發布不僅豐富了市場選擇,也推動了中國AI技術的普及和應用。
DeepSeek的崛起不僅是中國AI技術的勝利,更是全球AI技術發展的一個重要里程碑。它證明了開源和創新的力量是無窮的,也為中國的大模型創業公司帶來了新的機遇和挑戰。在未來的發展中,中國的大模型創業公司將繼續發揮自己在技術和產品上的優勢,推動全球AI技術的快速發展。