訂閱
糾錯
加入自媒體

DeepSeek的“鯰魚效應”

圖片

【潮汐商業(yè)評論原創(chuàng)】

蛇年前夕,DeepSeek猶如一顆“原子彈”般震撼了全球人工智能領域。

這款主打“極致性價比”的大語言模型,不僅在性能上比肩OpenAI的頂尖模型o1,其成本更是僅為GPT-4o的十分之一,API調用成本更是低至OpenAI的三十分之一。

這證明了AI企業(yè)依靠燒錢卷“投流”“獲客”的路徑不可行,更凸顯了長期主義地原始創(chuàng)新和低成本研發(fā)的重要性。

這也打破了技術閉源的OpenAI和英偉達的市場壟斷,更引發(fā)了全球科技巨頭的股價波動,英偉達市值一夜之間蒸發(fā)4.3萬億元。

目前,DeepSeek累計用戶已經超過了1.25億。它像鯰魚一樣,攪動全球人工智能領域,讓國內AI基建重拾信心,被稱為“國運”級別的存在。

01 新路徑彎道搶跑

AI大模型是一個重資產行業(yè),2024年Scaling Law仍未失效,隨著模型不斷變大,訓練新模型需要更多的數據、更多的算力。

這意味著需要充足的資金支撐。一位大廠高層給出判斷,做大模型,“一年低消也要20億-30億美元”。

DeepSeek的出現,證明了AI企業(yè)依靠燒錢卷“投流”“獲客”的路徑是不可行的,以往中國AI大模型“卷”算力、“卷”價格、“卷”獲客、“卷”變現能力,如今人們更認可長期主義的原始創(chuàng)新,企業(yè)應當思考架構創(chuàng)新和低成本研發(fā),而不是一味燒錢。

圖片

在過去的2024年,月之暗面的Kimi和字節(jié)跳動的豆包輪番成為大眾追捧的AI應用。它們背后是重金推廣和瘋狂卷算力。

以抖音為例,2024年字節(jié)跳動才開始在大模型上發(fā)力,憑借此前的火山云基礎設施和人才團隊積累,以及大規(guī)模資金投入和四處挖人。在互聯網四巨頭里,字節(jié)跳動在AI領域的投入上高達800億人民幣,遠超騰訊、阿里、百度。

字節(jié)跳動旗下火山引擎支持多芯、多云架構,擁有超大規(guī)模算力,支持萬卡集群組網、萬億參數MoE大模型;提供超高性能網絡,支持3.2TbpsRDMA網絡,全球網絡POP覆蓋廣,時延優(yōu)化最高達75%,在算力資源上優(yōu)勢也很明顯。

DeepSeek的出現推動了AI技術更加普及和高效,其崛起將推動小型化模型即邊緣AI的推廣,使云端和邊緣處理的混合AI模型被認為是AI未來的發(fā)展方向。

02 與友商們都“交個朋友”

DeepSeek解決了國產AI領域的困局,應用的落地,激活了整個行業(yè)。國產芯片、軟硬件公司、云廠商紛紛接入DeepSeek“交個朋友”。

大模型企業(yè)們對于算力的需求不斷攀升,對于云服務的需求提升明顯。騰訊云、阿里云、華為云、百度智能云、火山引擎等數十家云計算服務龍頭,拆掉了圍墻,都推出限時優(yōu)惠、包年包月等選項。

在芯片領域,華為昇騰、沐曦科技、摩爾線程、壁仞科技等10多家國產AI芯片企業(yè),都表示適配了DeepSeek原版或“蒸餾”后的小尺寸版本。

同時,國產手機品牌和新能源汽車品牌也紛紛接入DeepSeek。

圖片

另外,DeepSeek也刺激了阿里云通義團隊發(fā)布旗艦模型“Qwen2.5-Max”,成為第二家可以比肩美國OpenAI公司o1系列的國產大語言模型,讓行業(yè)內外為之振奮。

DeepSeek的效應還在持續(xù),將吸引以華為為代表(還包括寒武紀、海光、摩爾線程等)的國產算力廠商會投入更大資源支持國產大模型的適配,政府資源的支持力度也會加大,這有利于國內人工智能的產業(yè)鏈更好發(fā)展。

同時也會加劇競爭,頭部優(yōu)勢廠商變強,一批原先瞄準通用大模型為目標的創(chuàng)業(yè)公司和互聯網公司將因為資源無法支撐而退出角逐,轉而做特定方向的人工智能應用落地,這有助于我們國內人工智能產業(yè)資源的更合理分布。

DeepSeek驗證的長思維鏈模式,有助于整個產業(yè)鏈降低在數據推理路徑標注的投入,未來大模型在需要復雜推理的應用落地過程會進一步加快。

從DeepSeek的推出到應用端鋪開布局,再到投資者重新理解中國科技企業(yè)的技術潛力、對科技股價值重估,這種轉換讓人炫目。DeepSeek“國運”系身一點都不夸張。

03 國產大模型有了新奔頭

DeepSeek的爆火出圈,也讓美國和歐洲看到,中國在大模型產業(yè)已經形成一批頗具實力和影響力的公司,其中有字節(jié)跳動、阿里、騰訊等大廠身影,也有月之暗面、智譜、MiniMax等初創(chuàng)企業(yè)。

客觀來講,國內無論是DeepSeek V3/R1、訊飛星火X1,還是字節(jié)的豆包、阿里的通義千問等國產大模型,目前和OpenAI的o3相比在現實物理規(guī)律的理解和運用、超復雜科學問題的求解、多模態(tài)視頻流輸入理解等高難度任務上還是有差距。

圖片

通用人工智能也不僅局限于此,在多模態(tài)大模型、具身智能、世界模型、環(huán)境模擬器等多個方面,中國的人工智能都有可挖掘的巨大空間,尤其是在高制程人工智能芯片的量產和演進能力方面。

當然,中國人工智能還是會面臨一些挑戰(zhàn)。

DeepSeek基于以英偉達算力取得的如此大的成就,勢必會引發(fā)海外針對芯片供應的封鎖手段不斷升級,給國產大模型的發(fā)展帶來更多限制。

尤其是美國大概率會對我國的英偉達算力獲取和國產算力海外投片采取更嚴苛的限制措施,H800、A100、H20等卡將會被全面禁止,給DeepSeek帶來的限制將日益增多。

所以實現國產算力的自主可控將更為關鍵。幸運的是,國產所有大模型中已經有一家公司憑借國產算力做出了成績。

訊飛星火大模型的訓練和推理都在國產算力上進行的,并且僅用了1萬張910B國產算力卡。科大訊飛不僅用比友商少數倍的算力取得了大模型研發(fā)上的一些成果,而且還做了大量國產算力平臺上的無人區(qū)的適配和效率優(yōu)化,可以說是真正把國產算力做到了極致效率,這比在英偉達上的實現更需要技術實力和勇氣,也更具有戰(zhàn)略意義。

圖片

如果訊飛星火能取得成功,將會像DeepSeek一樣,給予了我國同行們比以往更有信心和勇氣做底層的技術創(chuàng)新。

從這個角度上看,DeepSeek也只是為2025年中國人工智能拉開了大幕,真正的爆發(fā)正在迎面趕來。

潮汐編輯部的Jesse最近兩周已經習慣了在成稿后來一場“人機對話”,以期獲得些意外的觀點。這次當她把問題輸入,只見對話框旋轉半天后,DeepSeek彈出了一行字:“服務器繁忙,請稍后再試。”

DeepSeek以“白菜價”技術打破壟斷,用開源生態(tài)凝聚產業(yè)鏈,最終引爆了國內AI從技術到商業(yè)的全面升級。可這一切都來的太快了,烈火烹油,總要給Deepseek和整個AI行業(yè)一點時間適應。

正如DeepSeek創(chuàng)始人梁文鋒在采訪中所說,“以后硬核創(chuàng)新會越來越多。當這個社會讓硬核創(chuàng)新的人功成名就,群體性想法就會改變。我們只是還需要一堆事實和一個過程。”

你看,商業(yè)就是這樣。

       原文標題 : DeepSeek的“鯰魚效應”

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關注公眾號
    OFweek人工智能網
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號