英偉達近日宣布,其最新推出的DeepSeek-R1模型,在AI推理領(lǐng)域樹立了新的標桿。這款開放模型以其卓越的推理能力,為用戶提供了前所未有的智能體驗。
與傳統(tǒng)的AI模型不同,DeepSeek-R1并不直接給出答案,而是通過一系列復(fù)雜的推理過程,包括思路鏈、共識和搜索方法,來生成最佳答案。這一過程被稱為測試時間擴展,而DeepSeek-R1正是這一擴展定律的杰出代表。它充分展示了加速計算在AI推理中的關(guān)鍵作用。
由于能夠反復(fù)思考問題,DeepSeek-R1模型在推理過程中會產(chǎn)生更多的輸出標記,并延長生成周期。這種特性使得模型的質(zhì)量不斷提高,為用戶提供了更高質(zhì)量的響應(yīng)。然而,要實現(xiàn)實時推理和更高質(zhì)量的響應(yīng),需要大量的測試時計算,這也對推理部署的規(guī)模提出了更高的要求。
DeepSeek-R1在邏輯推理、數(shù)學(xué)、編碼和語言理解等任務(wù)中表現(xiàn)出色,其準確性遙遙領(lǐng)先。同時,它還具備高推理效率,能夠在短時間內(nèi)完成復(fù)雜的推理任務(wù)。
為了讓開發(fā)人員能夠安全地試驗這些功能,并構(gòu)建自己的專用代理,英偉達將6710億參數(shù)的DeepSeek-R1模型作為NVIDIA NIM微服務(wù)預(yù)覽版在build.nvidia.com上提供。這一舉措將極大地促進AI推理技術(shù)的發(fā)展和應(yīng)用。
據(jù)悉,DeepSeek-R1 NIM微服務(wù)在單個NVIDIA HGX H200系統(tǒng)上每秒可處理多達3,872個令牌,性能強勁。開發(fā)人員可以通過應(yīng)用程序編程接口(API)進行測試和試驗,這一接口預(yù)計很快將作為可下載的NIM微服務(wù)提供,成為NVIDIA AI Enterprise軟件平臺的一部分。
DeepSeek-R1 NIM微服務(wù)還支持行業(yè)標準API,簡化了部署過程。企業(yè)可以在其首選的加速計算基礎(chǔ)設(shè)施上運行NIM微服務(wù),以最大限度地提高安全性和數(shù)據(jù)隱私。通過使用NVIDIA AI Foundry和NVIDIA NeMo軟件,企業(yè)還可以為專門的AI代理創(chuàng)建定制的DeepSeek-R1 NIM微服務(wù)。
這一創(chuàng)新不僅推動了AI推理技術(shù)的發(fā)展,也為開發(fā)人員和企業(yè)提供了更加便捷、高效的AI解決方案。隨著DeepSeek-R1的廣泛應(yīng)用,我們有理由相信,未來的AI世界將更加智能、更加美好。