亚洲第一成年视频网站,女同性恋一区二区

突破英偉達封鎖、打破李彥宏斷言，DeepSeek憑什么逆襲？

2025-02-11 09:22

DeepSeek才是OpenSeek。

聚焦DeepSeek專題banner（補充標題） (4).png

如果你在年前剛買了英偉達的股票，那么這個春節(jié)或許會過得不太開心，自從DeepSeek在1月20日正式發(fā)布DeepSeek-R1模型并開源后，英偉達的股價就在除夕節(jié)的前一天來了一次“自由落體”，從148美元的高位一度跌到116美元。

微信截圖_20250208221917.png

圖源：百度

很多報道都將英偉達的股價暴跌歸咎于“AI界拼多多”DeepSeek-R1模型，這倒也沒錯，因為DeepSeek-R1以一種“蠻橫”的方式，打破了英偉達在AI算力層面的壟斷。不過，有人將其理解為DeepSeek-R1“不需要”英偉達顯卡，這顯然是錯誤的，畢竟DeepSeek-R1的訓練服務器用的也是英偉達計算卡，并不是和英偉達徹底割席。

其中的關鍵在于DeepSeek-R1是一個開源模型，采取的“蒸餾模型”對算力要求銳減，且不硬性綁定英偉達顯卡。在擺脫英偉達硬件束縛的情況下，仍然在推理性能等方面都表現出與ChatGPT-o1接近的能力，部分領域還有所超越。

簡而言之，DeepSeek讓英偉達的高算力顯卡不再是AI的“必選項”，這相當于給整個AI產業(yè)特別是中國AI產業(yè)注入了一劑強心針。但這對英偉達而言確實算不上是好消息，因為英偉達的高利潤，恰恰來源于AI生態(tài)的“割裂性”。

別名“CloseAI”，OpenAI從來都不Open

OpenAI的地位毋庸置疑，作為最早被廣泛認知的AI大模型企業(yè)，ChatGPT依然是頂流，并且也是所有AI大模型的對標基準。不過，雖然名字叫OpenAI，但是ChatGPT卻一點也不“Open”，甚至是對用戶使用限制最嚴格的AI之一。

比如，前段時間OpenAI就指責DeepSeek使用ChatGPT的數據進行模型“蒸餾”，違反了用戶使用條例里的相關規(guī)定，不過最終因為沒有證據，相關爭議不了了之。OpenAI CEO對外表示并沒有起訴DeepSeek的計劃，并直言DeepSeek做得很棒。

Sam_Altman_TechCrunch_SF_2019_Day_2_Oct_3_(cropped)_(cropped).jpg

圖源：維基百科

DeepSeek引發(fā)的AI行業(yè)震動，也在讓OpenAI重新審視自己的AI模型開放策略，并重新評估開源模型的可能。

這對英偉達的打擊是致命的：ChatGPT幾乎就是與英偉達AI生態(tài)深度綁定的代名詞，你甚至可將其稱為英偉達CUDA生態(tài)的基石。

微軟等OpenAI的金主一直希望OpenAI可適配更多類型的顯卡，然而到目前為止，其只是適配了部分AMD顯卡，而且還需要通過轉譯等方式來運行，效率和性能表現都遠不如直接用英偉達的顯卡來運行。

CUDA+ChatGPT，實質上組成了一個封閉式的AI生態(tài)，這讓需要頂級AI支持的企業(yè)不得不選擇與OpenAI及英偉達合作。在OpenAI的帶動下，Claude、Gemini等AI大模型幾乎都與英偉達深度綁定。英偉達除了擁有性能遙遙領先的算力卡，CUDA完善的生態(tài)和開發(fā)工具鏈也是吸引AI開發(fā)者的法寶。

咋看下來，AI似乎以封閉為主？實則不然，諸如AMD的ROCm、Khronos Group的OpenCL等AI生態(tài)反而走的都是開源形式。畢竟在CUDA生態(tài)占優(yōu)的情況下，其他生態(tài)只能通過開源來增加自己的盟友。

DeepSeek才是OpenSeek，開源贏了？

日光之下沒有新事。

當年PC產業(yè)，微軟與Intel聯(lián)合制霸，組建了沿襲多年的“Win-Tel”聯(lián)盟，Windows生態(tài)負責消耗Intel的算力，Intel不斷升級制程推動PC生態(tài)成熟與普及。歷史上甚至留下了“安迪比爾定律”這樣的名場面總結，也就是“Andy gives, Bill takes away”（安迪提供什么，比爾拿走什么），安迪·格魯夫作為英特爾的CEO，致力于提升硬件性能，而比爾·蓋茨則通過微軟的操作系統(tǒng)和應用程序不斷消耗這些性能，推動用戶不斷升級硬件。

兩個巨頭，賺得缽滿盆滿；余下玩家，跟著喝湯。在Win-Tel封閉聯(lián)盟下，Unix、Linux等開源生態(tài)來吸納盟友。

今天的AI計算格局，像極了PC發(fā)展歷程。AI大模型的生態(tài)日益割裂，OpenAI與英偉達等頭部企業(yè)試圖用封閉來確保領先，迫使后來者以開源來進行應對。幾年來，開源生態(tài)都無法與CUDA的完整生態(tài)抗衡，時間上并沒有一個可與ChatGPT抗衡的AI模型出現。

2024年，百度CEO李彥宏甚至多次斷言，“開源模型會越來越落后。”他的理由是，基礎模型文心 4.0 可根據需要，兼顧效果、相應速度、推理成本等各種考慮，剪裁出適合各種場景的更小尺寸模型，并且支持精調和 post pretrain。這樣通過降維剪裁出來的模型，比直接用開源模型調出來的模型，同等尺寸下，效果明顯更好；同等效果下，成本明顯更低。

對此，周鴻祎持反對意見，他認為“沒有開源就沒有 Linux、沒有互聯(lián)網，甚至包括我們自己借助了開源技術才能發(fā)展至今”。他還預言，在未來一到兩年內，開源技術的力量很可能會超過閉源技術。

觀點不重要，重要的是結果。橫空出世的DeepSeek，證明了開源的力量——這里雷科技要PS一下（杠精勿杠）：DeepSeek不是代碼開源，其只開源了部分推理代碼和模型權重，完整的訓練框架、系統(tǒng)代碼、數據處理等都沒有開源。不過，行業(yè)公認它依然是開源路線下的AI產物，其開源程度足以讓外界學習，給AI企業(yè)甚至AI巨頭啟發(fā)。

不是第一個開源的，為何DeepSeek贏了？

在DeepSeek前，市場上并不缺少高質量的開源AI大模型，比如Meta的Llama、阿里的Qwen等，但是在高質量AI模型里，只有DeepSeek選擇了MIT+類OpenRAIL的授權方式進行開源。

圖源：deepseek

目前DeepSeek開源社區(qū)已有多個開發(fā)者上傳數十款不同顯卡的算子庫。簡單來說，DeepSeek做好了一個底層，并搭好了一個基于英偉達顯卡的基礎模板，同時給出了基礎版的異構部署方案，「舞臺搭好了，現在請各位開始你們的表演」。

在MIT開源協(xié)議的基礎上，第三方可根據需要隨意修改DeepSeek的運行代碼，使其適配不同的硬件設備，這是DeepSeek-R1普及的第一個撒手锏（關于DeepSeek如何重新定義AI硬件掀起“DeepSeek硬件”潮流，雷科技已進行系列分析和報道，歡迎全網搜索查看）。

第二個撒手锏則是跨平臺的API封裝，如果你研究過DeepSeek-R1的部署代碼，會發(fā)現DeepSeek將CUDA、ROCm、OpenCL等底層指令都封裝為統(tǒng)一接口，這意味著開發(fā)者無需修改代碼就可在不同的AI硬件之間遷移模型。

為了更好地適配不同硬件生態(tài)，DeepSeek從底層開始對AI大模型和代碼進行優(yōu)化，并引入了即時編譯技術，讓AI模型可根據顯卡類型動態(tài)生成最優(yōu)計算圖，使得不同的計算設備，都可高效運行DeepSeek模型。

看起來似乎并不難，為什么此前沒有其他AI企業(yè)嘗試使用即時編譯技術，實現廣泛的硬件適配呢？原因出在代碼上。DeepSeek為解決H800顯卡性能不足以及跨芯片通信的瓶頸問題，最終選擇繞過CUDA和C/C++，從更底層的PTX開始編碼。

你可以將PTX理解為一種接近匯編語言的玩意。開發(fā)者可通過PTX編寫指令，直接調動硬件來運行AI。PTX雖是英偉達AI生態(tài)的一部分，但是并不針對特定的GPU運行，因此將其轉譯為其他硬件平臺的指令后會遠比以往更高效和方便。

圖源：Codeplay

簡單地說，你可以將AI理解為一個項目組：用戶是公司的CEO，CUDA是項目組的管理人員，PTX是組員（實際上有更底層的干活人員）。在正常的流程中，你想執(zhí)行一個項目，需要先告訴CUDA你的需求，然后CUDA將其分解成不同的工作內容再轉給PTX讓“組員”執(zhí)行，這時候你的公司效率就取決于CUDA的數量與能力。

DeepSeek則制定了一個新的工作流程：你可與PTX更扁平地溝通，將工作直接分配到干活的人，相當于越過其中一個步驟，對整個流程進行提效。從DeepSeek公布的論文來看，他們成功地將流處理器（CUDA）的寄存器使用率從78%提升至92%、計算單元閑置時間減少40%、全局內存訪問延遲從600周期降至450周期，從而實現了算力效率的暴漲和算力成本的暴跌。

在更基礎的代碼系統(tǒng)支持下，DeepSeek的AI模型在轉譯時也擁有更高的效率，并且可在一定程度上繞開CUDA的限制，進而適配不同的硬件。實際上，已有很多人通過CPU來復現DeepSeek的AI模型部署，借助虛擬顯存等技術，將內存轉為顯存，利用核顯算力來驅動模型，極大地降低了AI大模型的部署門檻和成本。

DeepSeek的創(chuàng)新還有許許多多，比如混合顯卡集群調度算法的優(yōu)化、邊緣設備適配優(yōu)化、梯度累積顯存壓縮等一系列技術，使其可以更好地適配多顯卡系統(tǒng)。

前幾天小雷在朋友圈看到一個段子，英偉達、DeepSeek們最大的壁壘，除了自身足夠強大外，也與“這個世界會匯編語言的人越來越少”有關。因為英偉達的CUDA以及DeepSeek需要使用類匯編語言級能力開發(fā).

很多人都忽略了DeepSeek的軟件開發(fā)能力。想從PTX層面對代碼進行優(yōu)化，難度無異于使用匯編語言對系統(tǒng)內核進行編程，這是只有極少數頂層開發(fā)者具備的編程能力，其復雜度相當于手繪一部《黑神話悟空》一樣。正是因為有著強大的開發(fā)能力，DeepSeek才可與合作伙伴（如AMD、華為）深度合作，針對性優(yōu)化推理效率。

在小雷看來，DeepSeek給行業(yè)帶來的啟發(fā)不只是“蒸餾”等模型實現本身，它還展示了繞過CUDA等老生態(tài)，從更底層的代碼對AI大模型進行重構的巨大潛力，很可能會在行業(yè)掀起一股模仿潮流，讓更多AI公司用匯編語言來進行底層優(yōu)化。

掀起多層變革，DeepSeek真正改變了世界

在雷科技看來，DeepSeek給AI行業(yè)帶來的變革是深刻的：

1、史無前例“便宜”的AI讓AI有了工業(yè)化大生產的基礎，給大規(guī)模商業(yè)化的AI產品如AI搜索的PMF（產品市場契合度）創(chuàng)造了可能，這很重要�；ヂ�(lián)網有Google等現象級應用，移動互聯(lián)網有iPhone、微信等現象級產品，4G有抖音/TikTok等殺手級應用。如果一直沒有全民級的AI殺手锏應用，AI產業(yè)終將是越吹越大的泡沫，遲早會破。

（圖源：DeepSeek官網）

2、突破了英偉達在AI算力領域的封鎖，突破了“OpenAI+英偉達”的制霸聯(lián)盟，讓更多軟件AI開發(fā)者與芯片開發(fā)者可以抓住和推動AI浪潮，而這將進一步影響1。深層來看，DeepSeek也將助力世界各國突破美國在AI產業(yè)的制霸野心，讓好的技術成為人人可用的工具，讓所有主體在AI面前人人平等。

3、開源力量的勝利，將讓AI產業(yè)進行百家爭鳴的創(chuàng)新階段。DeepSeek為AI行業(yè)提供了一個全新的開源范式，并且直觀地展現了開源所帶來的收益和效果。從閉源到開源，這或許就是AI生態(tài)的一個里程碑式的轉折點。高手在民間，真正的創(chuàng)新一定來自于成敗上千萬的開發(fā)者，而不是少數巨頭。

毫無疑問，華麗出水的DeepSeek和它的團隊，在這個春節(jié)期間驚艷了世人，也真正意義上改變了世界。

原文標題 : 突破英偉達封鎖、打破李彥宏斷言，DeepSeek憑什么逆襲？