訂閱
糾錯(cuò)
加入自媒體

落選“果鏈”,別再捧殺DeepSeek了

2025-02-13 17:44
鋅刻度
關(guān)注

圖片

是對(duì)手也是隊(duì)友

撰文陳鄧新

編輯/ 李覲麟

排版/ Annalee

DeepSeek,持續(xù)正反饋AI賽道。

2025年2月13日,文心一言宣布將于4月1日0時(shí)起全面免費(fèi),所有PC端和APP端用戶均可體驗(yàn)文心系列最新模型,而此前只有免費(fèi)使用3.5版。

隨之而來的,則是輿論此起彼伏。

在蘋果不選擇DeepSeek作為“AI搭子”時(shí),The Information報(bào)道,蘋果考慮了多個(gè)國(guó)內(nèi)的對(duì)象,與阿里巴巴的合作已取得重大進(jìn)展,并明確拒絕了DeepSeek。

這意味著,DeepSeek落選了蘋果供應(yīng)鏈,令人唏噓不已。

其實(shí),BAT們與DeepSeek并非“針尖對(duì)麥芒”。

文小言、騰訊元寶等接入DeepSeek大模型,為用戶提供更多的AI選擇;阿里云、騰訊云、華為云、京東云、火山引擎、百度智能云等主流云服務(wù)平臺(tái)紛紛上線DeepSeek大模型,鼓勵(lì)用戶嘗鮮DeepSeek-R1、DeepSeek-V3……

BAT們與DeepSeek,是對(duì)手也是隊(duì)友?

沒有拔刀相向,反而雪中送炭

DeepSeek的初衷,是印證“條條大路通羅馬”。

生成式AI革命爆發(fā)之后,大模型站上了“風(fēng)口”,而算力成為衡量大模型能力的核心指標(biāo)之一,在力大飛磚的簡(jiǎn)單思維之下,硅谷將算力塑造為“皇冠上的明珠”,被視為難以企及的力量。

于是乎,算力緊張成為行業(yè)的關(guān)鍵詞,令A(yù)I成本長(zhǎng)期居高不下。

此背景下,DeepSeek通過算法優(yōu)化等手段降低了AI成本,用最少的資源達(dá)到最大的效果,為行業(yè)花小錢辦大事提供了新的思路和方向。

 

圖片

圖源:DeepSeek官網(wǎng)

這意味著,擴(kuò)大算力并非AI進(jìn)化的唯一途徑。

斯坦福大學(xué)人工智能實(shí)驗(yàn)室主任吳恩達(dá):“近年來,圍繞‘擴(kuò)大模型規(guī)模能夠推動(dòng)AI進(jìn)步’的觀點(diǎn)備受追捧。事實(shí)上,我曾是這一理念的早期支持者。”

不難看出,消解算力壁壘才是DeepSeek的真正影響。

巧的是,這也是全球互聯(lián)網(wǎng)巨頭共同的夙愿:唯有不斷降低成本,AI普惠才可以從夢(mèng)想照進(jìn)現(xiàn)實(shí),從而顛覆傳統(tǒng)的產(chǎn)業(yè)格局與商業(yè)模式。

更為重要的是,可以錯(cuò)位競(jìng)爭(zhēng)。

DeepSeek創(chuàng)始人梁文鋒表示:“長(zhǎng)遠(yuǎn)來說,我們希望形成一種生態(tài),就是業(yè)界直接使用我們的技術(shù)和產(chǎn)出,我們只負(fù)責(zé)基礎(chǔ)模型和前沿的創(chuàng)新,然后其他公司在DeepSeek 的基礎(chǔ)上構(gòu)建To B、To C的業(yè)務(wù)。”

關(guān)于此,從BAT們的態(tài)度就可見一斑。

QuestMobile的數(shù)據(jù)顯示,DeepSeek的日活躍用戶數(shù)已突破3000萬大關(guān),創(chuàng)造了史上最快達(dá)成這一成就的新紀(jì)錄。

隨之而來的則是,“服務(wù)器繁忙,請(qǐng)稍后再試”屢屢被用戶詬病。

 

圖片

屢屢被用戶詬病

騰訊云、阿里云、京東云、華為云、火山引擎、百度智能云等紛紛伸出援手,滿足外界對(duì)DeepSeek不斷增長(zhǎng)的推理需求。

譬如,京東云上線DeepSeek-R1和DeepSeek-V3模型,支持公有云在線部署、;焖接谢瘜(shí)例部署兩種模式。

再譬如,騰訊云支持開發(fā)者將“滿血版”DeepSeek 接入微信小程序,可實(shí)現(xiàn)智能對(duì)話、文本生成等功能。

天使投資人、資深人工智能專家郭濤認(rèn)為DeepSeek不會(huì)沖擊行業(yè)原有的競(jìng)爭(zhēng)格局:“文心一言、通義千問等AI大模型都已建立起完善的生態(tài)體系,且背后有百度、阿里巴巴等強(qiáng)大企業(yè)的支持,技術(shù)實(shí)力雄厚,能夠持續(xù)投入研發(fā)進(jìn)行技術(shù)迭代升級(jí)。”

AI創(chuàng)新是一場(chǎng)馬拉松而非短跑

以上可見,BAT們對(duì)DeepSeek的態(tài)度頗為友好,這背后的緣由有三。

首先,降本一直進(jìn)行中。

DeepSeek之前,BAT們就在不斷推動(dòng)AI降低成本,也取得非常不錯(cuò)的成就,共同推動(dòng)大模型定價(jià)進(jìn)入“厘時(shí)代”。

事實(shí)上,BAT們的創(chuàng)新也可圈可點(diǎn)。

 譬如,字節(jié)跳動(dòng)設(shè)計(jì)了一個(gè)全新的稀疏模型架構(gòu)UltraMem,有效解決了傳統(tǒng)主流MoE架構(gòu)存在的推理時(shí)高額訪存問題,從而提升推理速度2倍至6倍,推理成本最高可降低83%。

 上述架構(gòu)創(chuàng)新,與DeepSeek有異曲同工之妙。

再譬如,百度點(diǎn)亮國(guó)內(nèi)首個(gè)自研萬卡集群,有效解決了過去算力價(jià)格高以及無法穩(wěn)定應(yīng)用的問題,通過集群效能最大化達(dá)到降低單位算力成本的目的。

“今天,創(chuàng)新速度比以往都快得多。摩爾定律中,每18個(gè)月,性能就會(huì)翻倍,價(jià)格減半;如今,大模型推理成本每年能降低90%以上。”李彥宏稱。

 

圖片

圖源:AI產(chǎn)品榜

其次,模型蒸餾成為競(jìng)爭(zhēng)新高地。

模型蒸餾成為獲取低成本AI的重要路徑,進(jìn)一步降低了大模型的門檻,為AI落地走進(jìn)千家萬戶提供了更多的可能。

李飛飛團(tuán)隊(duì)訓(xùn)練出的s1人工智能推理模型,就是其中的代表。

 s1人工智能推理模型以阿里巴巴通義千問為基座模型進(jìn)行微調(diào),蒸餾了谷歌推理模型Gemini 2.0 Flash Thinking Experimental的1000個(gè)樣本,在數(shù)學(xué)和編碼能力測(cè)試中的表現(xiàn)與OpenAI的o1和DeepSeek的R1等尖端推理模型類似,耗費(fèi)不到50美元。

換而言之,模型蒸餾為行業(yè)指明一個(gè)新的前進(jìn)方向。

德邦證券的研究表明,2025年將是模型蒸餾技術(shù)的爆發(fā)年,AI應(yīng)用的成本有望大幅下降,模型能力也將全面提升;通過引導(dǎo)和支持,AI模型不僅能夠在云端獲取巨大的優(yōu)勢(shì),也能在邊緣計(jì)算等端側(cè)應(yīng)用中發(fā)揮重要作用。

如此一來,BAT們有了更大的發(fā)力空間,沒有與DeepSeek較勁的必要。

中國(guó)首席經(jīng)濟(jì)學(xué)家論壇理事劉煜輝表示:“現(xiàn)實(shí)世界可以用來訓(xùn)練AI模型的數(shù)據(jù)資料已經(jīng)耗盡,現(xiàn)在大家都是相互借鑒數(shù)據(jù)相互蒸餾,大家的模型水平根本拉不開差距,拼的就是誰能夠找到新的應(yīng)用場(chǎng)景、誰能率先把價(jià)格打下來。”

再次,不排除結(jié)下善緣的可能。

種種跡象表明,DeepSeek雖然初期拒絕了融資,但隨著規(guī)模不斷擴(kuò)大,資源瓶頸問題肉眼可見,成為一個(gè)棘手的問題。

一名私募人士告訴鋅刻度:“DeepSeek背靠的幻方量化雖然是千億元體量,但客戶的錢不等于幻方的錢,更不等于可以投入的錢,遲早需要尋找外援。”

實(shí)際上,量化并不能長(zhǎng)時(shí)間“躺贏”。

幻方量化CEO陸政哲曾坦言:“迅速崛起、規(guī)?焖俜糯蟆⒂诛w快衰落消失,這仿佛是量化行業(yè)的死循環(huán),像懸在我們頭上的達(dá)摩克利斯之劍。”

從這個(gè)角度來看,BAT們可以在算力、數(shù)據(jù)、場(chǎng)景等全方位助力DeepSeek,大家各取所需實(shí)現(xiàn)雙贏。

實(shí)際上,BAT們一直青睞富有特色的AI初創(chuàng)企業(yè),被譽(yù)為“AI六小龍”的智譜AI、月之暗面、百川智能、零一萬物、階躍星辰、MiniMax,背后不乏騰訊、小米、美團(tuán)、阿里巴巴等身影。

總而言之,AI創(chuàng)新是一場(chǎng)馬拉松而非短跑,比拼的是耐力與毅力,無論BAT們這樣的頭部選手,還是DeepSeek這樣的初創(chuàng)企業(yè),都有彎道超車的機(jī)會(huì),相互借力與借鑒才可以共同提高,大家都有美好的未來。

那么,神話DeepSeek大可不必。

       原文標(biāo)題 : 落選“果鏈”,別再捧殺DeepSeek了

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)