訂閱
糾錯(cuò)
加入自媒體

DeepSeek真能超越美國AI界?

2025-01-31 10:46
壹番
關(guān)注

文|鄭亦久

在AI大模型的演進(jìn)似乎放緩甚至陷入停滯的2025年初,國產(chǎn)大模型DeepSeek的橫空出世,重新點(diǎn)燃了整個(gè)行業(yè)的激情。它不僅在多項(xiàng)標(biāo)準(zhǔn)評(píng)測(cè)中展現(xiàn)出驚人的性能,更通過開源策略獲得了廣泛的社區(qū)支持。一時(shí)間,全球媒體、行業(yè)專家、甚至是機(jī)構(gòu)投資人紛紛給予高度評(píng)價(jià),而這些反饋傳回國內(nèi)之后有人將其譽(yù)為“國產(chǎn)AI的里程碑”,更有甚者將其與“國運(yùn)”掛鉤,于是DeepSeek瞬間形成破圈之勢(shì),并直接登頂微博熱搜第一位。

微博截圖

然而,在這片贊譽(yù)聲中,往往更需要保持清醒的認(rèn)識(shí)。畢竟在AI領(lǐng)域,我們已經(jīng)目睹過太多曇花一現(xiàn)的“明星產(chǎn)品”,它們?cè)诙虝旱墓猸h(huán)過后,要么被市場(chǎng)淘汰,要么被證明徒有其表。

對(duì)于DeepSeek的評(píng)價(jià),既要看到它確實(shí)展現(xiàn)出的技術(shù)路線創(chuàng)新,更要考量其路徑實(shí)現(xiàn)背后的原理以及局限,更重要的是當(dāng)前這個(gè)AI幾乎以日新月異的發(fā)展階段,我們應(yīng)該以什么樣的心態(tài)來看待技術(shù)創(chuàng)新。

01

DeepSeek憑啥能讓

美國AI界抖一抖?DeepSeek最先引發(fā)熱潮是在美國,其更是在近期一舉反超ChatGPT,一舉登頂美區(qū)蘋果應(yīng)用商店免費(fèi)App排行第一,整個(gè)硅谷和AI界都對(duì)這款產(chǎn)品發(fā)出了極強(qiáng)好奇心。

蘋果應(yīng)用商店免費(fèi)App排行榜

毫無疑問,DeepSeek最近發(fā)布的DeepSeek-R1模型在AI領(lǐng)域掀起了一場(chǎng)技術(shù)革新的風(fēng)暴。這款開源推理大語言模型基于DeepSeek V3混合專家模型開發(fā),在數(shù)學(xué)、編程和推理任務(wù)上達(dá)到了與OpenAI的前沿推理模型o1相媲美的性能,而訓(xùn)練成本卻降低了90-95%。這一突破不僅展示了開源模型在向AGI邁進(jìn)的過程中正在快速追趕封閉的商業(yè)大模型,更重要的是揭示了一種全新的AI訓(xùn)練范式。DeepSeek的技術(shù)創(chuàng)新主要體現(xiàn)在以下幾個(gè)方面:首先是模型訓(xùn)練效率的突破性提升。DeepSeek V3僅使用了2788K H800訓(xùn)練時(shí)長(約合560萬美元成本)就達(dá)到了接近GPT-4的水平,這一數(shù)字之低令業(yè)界震驚。更重要的是,他們采用了“AI訓(xùn)練AI”的創(chuàng)新方法:使用R1模型生成合成數(shù)據(jù)來提升V3的能力。

DeepSeek V3測(cè)評(píng)

其次是在純強(qiáng)化學(xué)習(xí)方面的開創(chuàng)性嘗試。DeepSeek實(shí)際上開發(fā)了兩個(gè)R1模型:公開的R1和更具突破性的R1-Zero。R1-Zero的特別之處在于它完全摒棄了傳統(tǒng)的“基于人類反饋的強(qiáng)化學(xué)習(xí)”(RLHF)方法,而是采用純強(qiáng)化學(xué)習(xí)方式。他們給模型設(shè)置了兩個(gè)獎(jiǎng)勵(lì)函數(shù):一個(gè)用于判斷答案的正確性,另一個(gè)用于評(píng)估思維過程的合理性。這種方法讓模型能夠同時(shí)嘗試多個(gè)不同的答案,并通過這兩個(gè)獎(jiǎng)勵(lì)函數(shù)進(jìn)行評(píng)分。在這個(gè)自主學(xué)習(xí)的過程中,研究人員觀察到了一個(gè)有趣的現(xiàn)象,他們稱之為“醍醐灌頂”時(shí)刻。就像人類在解決難題時(shí)突然開竅一樣,AI模型在訓(xùn)練過程中學(xué)會(huì)了一種全新的思考方式:它會(huì)停下來重新思考問題,不急于得出結(jié)論。這個(gè)發(fā)現(xiàn)告訴我們,只要給AI足夠的學(xué)習(xí)空間和正確的目標(biāo),它就能自己發(fā)展出復(fù)雜的思維能力,不需要人類事無巨細(xì)地教導(dǎo)。

然而,這種完全自主學(xué)習(xí)的AI雖然聰明,但它的思考方式對(duì)人類來說很難理解。就像一個(gè)天才學(xué)生用自創(chuàng)的方法解題,雖然答案正確,但老師和同學(xué)都看不懂他的解題過程。為了解決這個(gè)問題,DeepSeek開發(fā)了更實(shí)用的R1模型。他們先教會(huì)AI用人類容易理解的方式來表達(dá)思路,然后再讓它自主學(xué)習(xí)和提升。這個(gè)過程就像是在保持天才創(chuàng)造力的同時(shí),教會(huì)他如何清晰地表達(dá)自己的想法。

此外,在知識(shí)傳遞結(jié)構(gòu)方面。DeepSeek發(fā)現(xiàn)了一種讓小型AI模型快速進(jìn)步的方法:用更強(qiáng)大的AI來給它們上課。這就像是讓一位資深教授來培養(yǎng)年輕教師,效果往往比讓年輕教師自己摸索要好得多。此發(fā)現(xiàn)非常重要,因?yàn)樗鼮榻鉀QAI普及過程中的成本問題提供了新思路。最令人驚喜的是,通過該方法訓(xùn)練出的小型模型,在某些數(shù)學(xué)測(cè)試中居然表現(xiàn)得比一些超大型AI還要好。這些創(chuàng)新成果確實(shí)令人振奮,尤其是在效率提升和成本降低方面的突破,為AI技術(shù)的進(jìn)一步普及帶來了新的可能。

但在為這些成就歡呼之前,也許還需要更多冷靜的思考:這些創(chuàng)新是否真的如表面看起來那么完美?DeepSeek的發(fā)展路徑是否真的可持續(xù)?同時(shí),在技術(shù)快速迭代的AI領(lǐng)域,或許更應(yīng)該退后一步以理性和務(wù)實(shí)的態(tài)度來評(píng)估這些新突破。

02

AI需要祛魅,

別再迷信一時(shí)造“新神”

在肯定DeepSeek成就的同時(shí),我們也要清醒地認(rèn)識(shí)到其局限性。Meta AI研究部門FAIR的首席科學(xué)家楊立昆最近對(duì)此提出了一個(gè)深刻的觀點(diǎn):當(dāng)人們看到DeepSeek的出色表現(xiàn)就認(rèn)為“中國在AI領(lǐng)域超越了美國”時(shí),這其實(shí)是一種誤讀。正確的理解應(yīng)該是“開源模型正在超越閉源專有模型”。他指出,DeepSeek的成功很大程度上得益于開源研究和開源社區(qū),如來自Meta的PyTorch和Llama,他們是在其他人的工作基礎(chǔ)上提出新想法并構(gòu)建的。正是因?yàn)檫@些工作都是公開發(fā)布和開源的,所以每個(gè)人都能從中受益——這正是開源研究和開源精神的力量所在。這一評(píng)論其實(shí)真正道出了關(guān)鍵。以DeepSeek最新的模型蒸餾實(shí)踐為例,其將蒸餾后的Llama模型以MIT許可證發(fā)布,實(shí)際上違反了Llama的原始許可協(xié)議。

DeepSeek模型蒸餾實(shí)踐

Meta推出的Llama大模型雖然是“開源”的,但并非像MIT許可證那樣完全無限制,DeepSeek無權(quán)單方面改變這一許可條款。此問題不僅暴露出DeepSeek在知識(shí)產(chǎn)權(quán)管理和商業(yè)合規(guī)性方面的不足,更反映出其發(fā)展很大程度上依賴于開源社區(qū)的貢獻(xiàn)。此外,雖然DeepSeek在技術(shù)層面確實(shí)有創(chuàng)新,但這些創(chuàng)新大多是在現(xiàn)有技術(shù)框架下的優(yōu)化和改進(jìn),而非根本性的突破。放眼整個(gè)AI領(lǐng)域的發(fā)展歷程,真正的技術(shù)革新往往來自于對(duì)基礎(chǔ)理論的突破和新范式的創(chuàng)立。從這個(gè)角度來看,DeepSeek的創(chuàng)新還停留在路徑“改良”層面,距離真正的技術(shù)突破還有很長的路要走。其次,在實(shí)際應(yīng)用層面,DeepSeek還面臨著諸多挑戰(zhàn)。大語言模型的商業(yè)化不僅需要過硬的技術(shù)實(shí)力,更需要考慮系統(tǒng)穩(wěn)定性、數(shù)據(jù)安全、成本效益等多個(gè)維度。目前DeepSeek還缺乏大規(guī)模商業(yè)應(yīng)用的驗(yàn)證,其在復(fù)雜實(shí)際場(chǎng)景中的表現(xiàn)還有待檢驗(yàn),像是最近兩天因?yàn)闊岫瘸掷m(xù)攀升,開始有更多普通用戶涌入后,光是27號(hào)這一天里就已經(jīng)多次出現(xiàn)服務(wù)宕機(jī)的情況。

DeepSeek App截圖

而如今AI產(chǎn)品的一大營收來源其實(shí)還是企業(yè)級(jí)應(yīng)用,在這一場(chǎng)景中穩(wěn)定性和可靠性的要求往往比簡(jiǎn)單的性能指標(biāo)更為重要。從產(chǎn)業(yè)發(fā)展的角度來看,當(dāng)前AI領(lǐng)域已經(jīng)進(jìn)入深度競(jìng)爭(zhēng)階段。領(lǐng)先企業(yè)不僅在技術(shù)上持續(xù)投入,更在積極構(gòu)建完整的生態(tài)系統(tǒng)。相比之下,DeepSeek還顯得有些單薄。僅靠開源策略和技術(shù)創(chuàng)新,很難在激烈的市場(chǎng)競(jìng)爭(zhēng)中建立持續(xù)的優(yōu)勢(shì)。如何將技術(shù)優(yōu)勢(shì)轉(zhuǎn)化為市場(chǎng)競(jìng)爭(zhēng)力,如何建立可持續(xù)的商業(yè)模式,這些都是DeepSeek亟待解決的問題。與此同時(shí),DeepSeek這一系列方法本身也被反饋到了開源社區(qū)中,顯然后續(xù)還會(huì)有更多公司基于其技術(shù)和理論進(jìn)一步向前發(fā)展。更重要的是,我們需要重新思考對(duì)AI技術(shù)創(chuàng)新的態(tài)度。在當(dāng)前AI發(fā)展的熱潮中,過度追捧某個(gè)特定產(chǎn)品或技術(shù)方案是非常危險(xiǎn)的信號(hào)。技術(shù)發(fā)展是一個(gè)漸進(jìn)的過程,需要在不斷試錯(cuò)和改進(jìn)中尋找最優(yōu)解。過高的期待不僅可能給企業(yè)帶來不必要的壓力,還可能誤導(dǎo)整個(gè)行業(yè)的發(fā)展方向。

圖源:網(wǎng)絡(luò)

正如DAIR.AI創(chuàng)始人Elvis所說的:“所有對(duì)DeepSeek-R1的陰謀論和過度解讀都令人尷尬。我們應(yīng)該回歸DeepSeek-R1的學(xué)術(shù)和 AI 應(yīng)用,從研究者的角度看到強(qiáng)化學(xué)習(xí)的價(jià)值,從開發(fā)者的角度看到更強(qiáng)的模型能力和本地模型場(chǎng)景。而不是讓這些虛假的敘事蒙蔽了你的眼睛,使你錯(cuò)過了DeepSeek-R1所能帶來的價(jià)值和機(jī)遇。開源研究和開源精神依然蓬勃發(fā)展。”這或許才是面對(duì)創(chuàng)新真正理性且審慎的態(tài)度——給予技術(shù)成長必要的時(shí)間和空間并專注于技術(shù)本身,而非在某種不知所以然的盲目對(duì)比中輕言勝負(fù)已分,或是將一次細(xì)分領(lǐng)域的技術(shù)演進(jìn)與某種宏大敘事強(qiáng)行綁定。

對(duì)于DeepSeek而言,通過站在前人積累之上做出技術(shù)決策實(shí)現(xiàn)創(chuàng)新,本身就證明了其能力和價(jià)值。當(dāng)下,整個(gè)開源社區(qū)的正面回應(yīng)也肯定了這一正反饋的可行性。之后,其需要做的則是進(jìn)一步拓寬其技術(shù)的衍生并不斷深化研究成果。站在更宏觀的角度而言,DeepSeek則更多證明了AI技術(shù)的競(jìng)爭(zhēng)與創(chuàng)新尚未迎來終局。

整個(gè)行業(yè)的創(chuàng)新也絕非僅僅通過囤積算力、無限資金就能完全形成壁壘。這也為更多中小型創(chuàng)業(yè)公司重新點(diǎn)燃了希望,畢竟誰也不希望AI行業(yè)早早變成如互聯(lián)網(wǎng)行業(yè)一樣“贏家通吃”的垃圾時(shí)間。

       原文標(biāo)題 : DeepSeek真能超越美國AI界?

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)