訂閱
糾錯(cuò)
加入自媒體

狂舞的DeepSeek、會(huì)扭秧歌的AI機(jī)器人,這個(gè)春節(jié)不一般

有點(diǎn)數(shù)·數(shù)字經(jīng)濟(jì)工作室原創(chuàng)

作   者 | 有 叔

微信ID | yds_sh

在辭舊迎新的蛇年春節(jié)假期,橫空出世的DeepSeek金蛇狂舞,AI機(jī)器人在春晚上扭起了秧歌,這些領(lǐng)先行業(yè)的“神秘東方力量”,給全球科技界帶來(lái)了“億點(diǎn)點(diǎn)”震撼。

憑一己之力,打壓了AI科技巨頭的估值

DeepSeek(深度求索)是量化巨頭幻方量化旗下大模型公司,1月20日,該公司正式發(fā)布推理大模型DeepSeek-R1。1月27日,DeepSeek應(yīng)用登頂蘋(píng)果中國(guó)地區(qū)和美國(guó)地區(qū)應(yīng)用商店免費(fèi)APP下載排行榜。被DeepSeek壓在身后的,包括了OpenAI旗下的ChatGPT以及Google Gemini等AI產(chǎn)品。這是第一次,有中國(guó)科技產(chǎn)品APP實(shí)現(xiàn)雙榜登頂。

更震撼的還在后面,美國(guó)時(shí)間1月27日,英偉達(dá)(Nasdaq:NVDA)股價(jià)暴跌16.86%收于每股118.58美元,跌至過(guò)去10月以來(lái)的最低點(diǎn);總市值2.90萬(wàn)億美元,一日蒸發(fā)5900億美元(約合人民幣4.28萬(wàn)億元),創(chuàng)史上最大單日個(gè)股市值蒸發(fā)紀(jì)錄。在英偉達(dá)的帶領(lǐng)下,美股半導(dǎo)體芯片板塊集體受挫,甲骨文下跌13.78%,超微電腦下跌12.49%,芯片制造商博通下跌17.4%,臺(tái)積電跌13%。

這些科技巨頭為何會(huì)在股市被“掀桌”呢?這是因?yàn)镈eepSeek用開(kāi)源的方式、更低的成本實(shí)現(xiàn)了高性能的大模型,從而引發(fā)了資本市場(chǎng)對(duì)AI科技巨頭估值的擔(dān)憂(yōu)。

先說(shuō)開(kāi)源,由微軟、OpenAI、英偉達(dá)等公司構(gòu)筑出的“美式AI生態(tài)有機(jī)體”,商業(yè)化的前提是“不能開(kāi)源”——要通過(guò)AI模型本身收費(fèi)或者將其納入付費(fèi)產(chǎn)品之中完成商業(yè)閉環(huán)。而DeepSeek-R1則是一款開(kāi)源推理大模型,基于相關(guān)的許可協(xié)議,DeepSeek-R1允許全球開(kāi)發(fā)者自由地修改、使用、分發(fā)模型,甚至還可以進(jìn)行衍生開(kāi)發(fā)和商用。

除了商業(yè)化方面的考量,DeepSeek開(kāi)源帶給OpenAI的另一個(gè)巨大挑戰(zhàn)是,當(dāng)開(kāi)源產(chǎn)品的“能力”和閉源產(chǎn)品接近甚至反超后者時(shí),對(duì)閉源產(chǎn)品的沖擊將是巨大的。DeepSeek下載熱度的激增,背后的核心原因之一正是開(kāi)源:用戶(hù)可以在自己的服務(wù)器或云端免費(fèi)部署DeepSeek-R1,且大幅降低(甚至不需要)API調(diào)用費(fèi)用。

DeepSeek第二個(gè)驚人之處,是其極低的預(yù)訓(xùn)練成本。性能比肩GPT-4o的DeepSeek-V3,投入研發(fā)費(fèi)用為558萬(wàn)美元,訓(xùn)練成本不到GPT-4o的1/20,且只用了2048張H100的GPU集群,用時(shí)僅53天。在同等水平下,哪怕是全球AI第一梯隊(duì)的頭部公司,至少也要用到1.6萬(wàn)張以上的GPU進(jìn)行訓(xùn)練。

大幅降低了技術(shù)成本的DeepSeek,對(duì)算力市場(chǎng)形成了強(qiáng)大的沖擊。它背后的那個(gè)男人,也來(lái)到了聚光燈下。

量化私募大佬,一轉(zhuǎn)身大模型就掀起了價(jià)格戰(zhàn)

2025年1月20日,AI初創(chuàng)公司深度求索創(chuàng)始人梁文鋒受邀出席相關(guān)部門(mén)座談會(huì),并做了相關(guān)發(fā)言。國(guó)內(nèi)做AI通用大模型的大廠不下五個(gè),但只邀請(qǐng)了梁文鋒作為AI領(lǐng)域的企業(yè)家代表。而就在這一天,發(fā)布了DeepSeek-R1,梁文鋒也隨即被社會(huì)大眾所關(guān)注。

1985年,梁文鋒出生在廣東湛江吳川市的一個(gè)普通家庭,父母都是小學(xué)語(yǔ)文老師。這個(gè)來(lái)自四線(xiàn)城市的少年,對(duì)數(shù)學(xué)特別感興趣,初中時(shí)期就學(xué)完了高中數(shù)學(xué),甚至開(kāi)始學(xué)大學(xué)的數(shù)學(xué)。

2002年,17歲的梁文鋒以全校第一的成績(jī)考上浙江大學(xué)本科電子信息工程專(zhuān)業(yè),于2007年考上浙江大學(xué)信息與通信工程專(zhuān)業(yè)研究生。在大學(xué)期間,他遇到了改變自己一生的兩件事:愛(ài)上了機(jī)器學(xué)習(xí),迷上了量化交易。

畢業(yè)之后,梁文鋒與同學(xué)一起開(kāi)始積累市場(chǎng)行情數(shù)據(jù)和探索全自動(dòng)量化交易。2015年,當(dāng)其他人還在為股市的跌宕起伏心驚膽戰(zhàn)時(shí),30歲的梁文鋒在杭州創(chuàng)立了幻方科技,投身于全自動(dòng)量化交易,立志成為世界頂級(jí)的量化對(duì)沖基金。

盡管當(dāng)時(shí)公司只有10張GPU顯卡,但不久之后的2016年10月,幻方量化推出第一個(gè)AI模型,第一份由深度學(xué)習(xí)生成的交易倉(cāng)位上線(xiàn)執(zhí)行。到2017年底,幾乎所有的量化策略都采用AI模型計(jì)算。有了AI加持助力,用了4年時(shí)間,公司就做到了百億規(guī)模,又用2年時(shí)間突破千億大關(guān)。

從一開(kāi)始,投資賺錢(qián)就不是梁文鋒的唯一目的,反而是賺到了足夠多的錢(qián),才能更好地去研究人工智能。2019年,幻方量化成立AI公司,其自研的深度學(xué)習(xí)訓(xùn)練平臺(tái)“螢火一號(hào)”總投資近2億元,搭載了1100塊GPU;兩年后,“螢火二號(hào)”的投入增加到10億元,搭載了約1萬(wàn)張英偉達(dá)A100顯卡。通常認(rèn)為,1萬(wàn)枚英偉達(dá)A100芯片是做自訓(xùn)大模型的算力門(mén)檻,而單從算力角度看,幻方甚至比很多大廠都更早拿到了做ChatGPT的入場(chǎng)券。

有了這些積累,梁文鋒在2023年7月創(chuàng)立了深度求索(DeepSeek),要做AI大模型。"現(xiàn)在入場(chǎng),怎么跟OpenAI這樣的行業(yè)巨頭競(jìng)爭(zhēng)?" 面對(duì)質(zhì)疑,篤信“人工智能一定會(huì)改變世界”的梁文鋒沒(méi)有多做解釋。不到一年的時(shí)間,所有人就都閉嘴了,只剩下了佩服。

2024年5月,DeepSeek發(fā)布了DeepSeek-V2,憑借創(chuàng)新的模型架構(gòu)和史無(wú)前例的性?xún)r(jià)比,以"AI界的拼多多"迅速出圈。反卷大廠的梁文鋒,在AI領(lǐng)域復(fù)制了黃崢式“后來(lái)居上”的故事,并在國(guó)內(nèi)掀起打到骨折的大模型價(jià)格戰(zhàn)。

DeepSeek-V2的關(guān)鍵開(kāi)發(fā)者之一羅福莉曾在社交平臺(tái)撰文表示,“單論DeepSeek-V2模型的中文水平,是真實(shí)處在國(guó)內(nèi)外閉源模型的第一梯隊(duì)”,“外加1元/百萬(wàn)輸入Tokens的價(jià)格,只有GPT4價(jià)格的1/100,性?xún)r(jià)比之王”。這個(gè)羅福莉,就是此前傳聞小米創(chuàng)始人雷軍要開(kāi)千萬(wàn)年薪挖走的天才少女。

梁文鋒的用人之道也很有意思:不要海歸,只要本土工程師;不要老手,偏愛(ài)應(yīng)屆生;沒(méi)有KPI,全憑興趣干活。他說(shuō):“一件激動(dòng)人心的事,或許不能單純用錢(qián)衡量。就像家里買(mǎi)鋼琴,一來(lái)買(mǎi)得起,二來(lái)是因?yàn)橛幸蝗杭庇谠谏厦鎻椬鄻?lè)曲的人。”

底層技術(shù)路線(xiàn)上的顛覆,實(shí)現(xiàn)了彎道趕超

從技術(shù)原理上來(lái)說(shuō),DeepSeek的崛起,尤其是最新一代deepseek R1的成功,來(lái)自于它所采用的RL強(qiáng)化學(xué)習(xí)策略,這是它以極低的成本卻可以實(shí)現(xiàn)和GPT-4o差不多效果的根本原因。

以GPT為代表的傳統(tǒng)AI,其策略的本質(zhì)是"在人類(lèi)選擇下的猜謎游戲"——GPT們其實(shí)并不會(huì)真正思考,而是通過(guò)數(shù)據(jù)訓(xùn)練,生成一些"看似靠譜實(shí)則無(wú)法深究"的東西,比如早期繪畫(huà)AI會(huì)把人手畫(huà)出六個(gè)指頭,就是因?yàn)锳I不知道人該有幾個(gè)指頭,只是通過(guò)大量的數(shù)據(jù)訓(xùn)練,能生成一個(gè)"大概是這樣"的東西。之后再由人類(lèi)進(jìn)行篩選,把不靠譜的結(jié)果去除掉,才能得到最終的作品。

而對(duì)DeepSeek來(lái)說(shuō),它完全拋棄了這種"猜謎"的訓(xùn)練方式,轉(zhuǎn)而采用了之前在圍棋和智能駕駛領(lǐng)域常用的RL策略(強(qiáng)化學(xué)習(xí))。如果說(shuō)以前的策略是人類(lèi)告訴AI什么是對(duì)的什么是錯(cuò)的,那么RL策略,就是真正地讓AI學(xué)會(huì)認(rèn)識(shí)世界、了解事物規(guī)律,更加自主地去推理探索。

在傳統(tǒng)技術(shù)路徑下,90%的算力消耗在試錯(cuò)過(guò)程中,而Deepseek的自主學(xué)習(xí)機(jī)制能將無(wú)效訓(xùn)練降低60%。因?yàn)榈讓蛹夹g(shù)路線(xiàn)上的顛覆,deepseek R1也把運(yùn)行成本大大降低——比起硅谷動(dòng)輒數(shù)億數(shù)十億美金的投資和數(shù)萬(wàn)張顯卡的超級(jí)集群,這個(gè)國(guó)產(chǎn)大模型僅僅靠著2000多張顯卡和600萬(wàn)美元左右的成本就實(shí)現(xiàn)了近似乃至更好的效果。

對(duì)我國(guó)初創(chuàng)公司來(lái)說(shuō),更關(guān)鍵的一點(diǎn)是,RL策略對(duì)并行計(jì)算的需求較傳統(tǒng)架構(gòu)下降40%,這直接打破了堆砌算力、數(shù)據(jù)的美國(guó)式AI道路,使得國(guó)產(chǎn)顯卡和國(guó)產(chǎn)芯片有機(jī)會(huì)實(shí)現(xiàn)對(duì)英偉達(dá)等海外巨頭的替代。

說(shuō)到這里,DeepSeek的崛起,就不僅僅是技術(shù)側(cè)的意義了:一家誕生在中國(guó)的民營(yíng)公司,不超過(guò)200人的本土青年工程師團(tuán)隊(duì),繞開(kāi)了美國(guó)人所探索的“成功模式道路”,采取了創(chuàng)新的思路和開(kāi)源的方式,以極低的成本創(chuàng)造了業(yè)界矚目的成就,實(shí)現(xiàn)了彎道趕超。

作為硅谷眼中“神秘的東方力量”,Scale AI創(chuàng)始人亞歷山大·王(Alexandr Wang)評(píng)價(jià)DeepSeek道,“過(guò)去十年來(lái),美國(guó)可能一直在人工智能競(jìng)賽中領(lǐng)先于中國(guó),但DeepSeek的AI大模型發(fā)布可能會(huì)‘改變一切’。”

寫(xiě)在最后……

DeepSeek的橫空出世,讓自詡領(lǐng)先至少10年以上的META和CHAT gpt有點(diǎn)不知該何去何從了。號(hào)稱(chēng)“星球大戰(zhàn)”2.0版本,并計(jì)劃耗費(fèi)天文數(shù)字的星際之門(mén)還沒(méi)打開(kāi)好像就該關(guān)上了——美國(guó)總統(tǒng)特朗普在會(huì)議上提到DeepSeek的出現(xiàn)為美國(guó)的企業(yè)敲響了警鐘,“我們需要集中精力在競(jìng)爭(zhēng)中獲勝”。相隔一天,據(jù)外媒報(bào)道,多名美國(guó)官員稱(chēng)DeepSeek是“偷竊”,正對(duì)其展開(kāi)國(guó)家安全調(diào)查。

在除夕這天震撼世界的,還有同樣是來(lái)自杭州的宇樹(shù)科技。在央視春晚現(xiàn)場(chǎng),來(lái)自宇樹(shù)科技的人形機(jī)器人H1跳起了AI機(jī)器秧歌,還能多角度轉(zhuǎn)手絹。

這些機(jī)器人身上裝備了多套高科技設(shè)備,如高精度3D激光SLAM自主定位和導(dǎo)航、多智能體協(xié)同規(guī)劃、先進(jìn)組網(wǎng)方案和全身AI運(yùn)動(dòng)控制,可以讓他們?cè)谖枧_(tái)上走得穩(wěn)穩(wěn)當(dāng)當(dāng),動(dòng)作整齊得就像復(fù)制粘貼一樣,這些技術(shù)不僅讓他們們定位超精準(zhǔn),連接超穩(wěn)定,還能應(yīng)對(duì)各種突發(fā)狀況?梢哉f(shuō),這是人類(lèi)歷史上首次大型全AI驅(qū)動(dòng)的全自動(dòng)集群人形機(jī)器。前些年不可一世的波士頓動(dòng)力機(jī)器人,好像三下兩下,也被宇樹(shù)趕上了。

從大疆、宇樹(shù)再到石破天驚的六代機(jī)、DeepSeek,東方大國(guó)不斷涌現(xiàn)出改寫(xiě)世界技術(shù)版圖的高科技企業(yè)。讓世界目不暇接,甚至逼得某些國(guó)家要采取并不光明正大的反制措施了。

“中國(guó)必然需要有人站到技術(shù)的前沿”,梁文鋒此前接受采訪時(shí)曾表示,回望過(guò)去30多年IT浪潮,中國(guó)基本沒(méi)有參與到真正的技術(shù)創(chuàng)新里。“我們覺(jué)得現(xiàn)在最重要的是參與到全球創(chuàng)新的浪潮里去。”被外界視為理想主義者的他說(shuō),“過(guò)去很多年,中國(guó)公司習(xí)慣了別人做技術(shù)創(chuàng)新,我們拿過(guò)來(lái)做應(yīng)用變現(xiàn),但這并非一種理所當(dāng)然。這一波浪潮里,我們的出發(fā)點(diǎn),就不是趁機(jī)賺一筆,而是走到技術(shù)的前沿,去推動(dòng)整個(gè)生態(tài)發(fā)展。”

       原文標(biāo)題 : 狂舞的DeepSeek、會(huì)扭秧歌的AI機(jī)器人,這個(gè)春節(jié)不一般

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)