狂舞的DeepSeek、會(huì)扭秧歌的AI機(jī)器人,這個(gè)春節(jié)不一般
有點(diǎn)數(shù)·數(shù)字經(jīng)濟(jì)工作室原創(chuàng)
作 者 | 有 叔
微信ID | yds_sh
在辭舊迎新的蛇年春節(jié)假期,橫空出世的DeepSeek金蛇狂舞,AI機(jī)器人在春晚上扭起了秧歌,這些領(lǐng)先行業(yè)的“神秘東方力量”,給全球科技界帶來(lái)了“億點(diǎn)點(diǎn)”震撼。
憑一己之力,打壓了AI科技巨頭的估值
DeepSeek(深度求索)是量化巨頭幻方量化旗下大模型公司,1月20日,該公司正式發(fā)布推理大模型DeepSeek-R1。1月27日,DeepSeek應(yīng)用登頂蘋(píng)果中國(guó)地區(qū)和美國(guó)地區(qū)應(yīng)用商店免費(fèi)APP下載排行榜。被DeepSeek壓在身后的,包括了OpenAI旗下的ChatGPT以及Google Gemini等AI產(chǎn)品。這是第一次,有中國(guó)科技產(chǎn)品APP實(shí)現(xiàn)雙榜登頂。
更震撼的還在后面,美國(guó)時(shí)間1月27日,英偉達(dá)(Nasdaq:NVDA)股價(jià)暴跌16.86%收于每股118.58美元,跌至過(guò)去10月以來(lái)的最低點(diǎn);總市值2.90萬(wàn)億美元,一日蒸發(fā)5900億美元(約合人民幣4.28萬(wàn)億元),創(chuàng)史上最大單日個(gè)股市值蒸發(fā)紀(jì)錄。在英偉達(dá)的帶領(lǐng)下,美股半導(dǎo)體芯片板塊集體受挫,甲骨文下跌13.78%,超微電腦下跌12.49%,芯片制造商博通下跌17.4%,臺(tái)積電跌13%。
這些科技巨頭為何會(huì)在股市被“掀桌”呢?這是因?yàn)镈eepSeek用開(kāi)源的方式、更低的成本實(shí)現(xiàn)了高性能的大模型,從而引發(fā)了資本市場(chǎng)對(duì)AI科技巨頭估值的擔(dān)憂(yōu)。
先說(shuō)開(kāi)源,由微軟、OpenAI、英偉達(dá)等公司構(gòu)筑出的“美式AI生態(tài)有機(jī)體”,商業(yè)化的前提是“不能開(kāi)源”——要通過(guò)AI模型本身收費(fèi)或者將其納入付費(fèi)產(chǎn)品之中完成商業(yè)閉環(huán)。而DeepSeek-R1則是一款開(kāi)源推理大模型,基于相關(guān)的許可協(xié)議,DeepSeek-R1允許全球開(kāi)發(fā)者自由地修改、使用、分發(fā)模型,甚至還可以進(jìn)行衍生開(kāi)發(fā)和商用。
除了商業(yè)化方面的考量,DeepSeek開(kāi)源帶給OpenAI的另一個(gè)巨大挑戰(zhàn)是,當(dāng)開(kāi)源產(chǎn)品的“能力”和閉源產(chǎn)品接近甚至反超后者時(shí),對(duì)閉源產(chǎn)品的沖擊將是巨大的。DeepSeek下載熱度的激增,背后的核心原因之一正是開(kāi)源:用戶(hù)可以在自己的服務(wù)器或云端免費(fèi)部署DeepSeek-R1,且大幅降低(甚至不需要)API調(diào)用費(fèi)用。
DeepSeek第二個(gè)驚人之處,是其極低的預(yù)訓(xùn)練成本。性能比肩GPT-4o的DeepSeek-V3,投入研發(fā)費(fèi)用為558萬(wàn)美元,訓(xùn)練成本不到GPT-4o的1/20,且只用了2048張H100的GPU集群,用時(shí)僅53天。在同等水平下,哪怕是全球AI第一梯隊(duì)的頭部公司,至少也要用到1.6萬(wàn)張以上的GPU進(jìn)行訓(xùn)練。
大幅降低了技術(shù)成本的DeepSeek,對(duì)算力市場(chǎng)形成了強(qiáng)大的沖擊。它背后的那個(gè)男人,也來(lái)到了聚光燈下。
量化私募大佬,一轉(zhuǎn)身大模型就掀起了價(jià)格戰(zhàn)
2025年1月20日,AI初創(chuàng)公司深度求索創(chuàng)始人梁文鋒受邀出席相關(guān)部門(mén)座談會(huì),并做了相關(guān)發(fā)言。國(guó)內(nèi)做AI通用大模型的大廠不下五個(gè),但只邀請(qǐng)了梁文鋒作為AI領(lǐng)域的企業(yè)家代表。而就在這一天,發(fā)布了DeepSeek-R1,梁文鋒也隨即被社會(huì)大眾所關(guān)注。
1985年,梁文鋒出生在廣東湛江吳川市的一個(gè)普通家庭,父母都是小學(xué)語(yǔ)文老師。這個(gè)來(lái)自四線(xiàn)城市的少年,對(duì)數(shù)學(xué)特別感興趣,初中時(shí)期就學(xué)完了高中數(shù)學(xué),甚至開(kāi)始學(xué)大學(xué)的數(shù)學(xué)。
2002年,17歲的梁文鋒以全校第一的成績(jī)考上浙江大學(xué)本科電子信息工程專(zhuān)業(yè),于2007年考上浙江大學(xué)信息與通信工程專(zhuān)業(yè)研究生。在大學(xué)期間,他遇到了改變自己一生的兩件事:愛(ài)上了機(jī)器學(xué)習(xí),迷上了量化交易。
畢業(yè)之后,梁文鋒與同學(xué)一起開(kāi)始積累市場(chǎng)行情數(shù)據(jù)和探索全自動(dòng)量化交易。2015年,當(dāng)其他人還在為股市的跌宕起伏心驚膽戰(zhàn)時(shí),30歲的梁文鋒在杭州創(chuàng)立了幻方科技,投身于全自動(dòng)量化交易,立志成為世界頂級(jí)的量化對(duì)沖基金。
盡管當(dāng)時(shí)公司只有10張GPU顯卡,但不久之后的2016年10月,幻方量化推出第一個(gè)AI模型,第一份由深度學(xué)習(xí)生成的交易倉(cāng)位上線(xiàn)執(zhí)行。到2017年底,幾乎所有的量化策略都采用AI模型計(jì)算。有了AI加持助力,用了4年時(shí)間,公司就做到了百億規(guī)模,又用2年時(shí)間突破千億大關(guān)。
從一開(kāi)始,投資賺錢(qián)就不是梁文鋒的唯一目的,反而是賺到了足夠多的錢(qián),才能更好地去研究人工智能。2019年,幻方量化成立AI公司,其自研的深度學(xué)習(xí)訓(xùn)練平臺(tái)“螢火一號(hào)”總投資近2億元,搭載了1100塊GPU;兩年后,“螢火二號(hào)”的投入增加到10億元,搭載了約1萬(wàn)張英偉達(dá)A100顯卡。通常認(rèn)為,1萬(wàn)枚英偉達(dá)A100芯片是做自訓(xùn)大模型的算力門(mén)檻,而單從算力角度看,幻方甚至比很多大廠都更早拿到了做ChatGPT的入場(chǎng)券。
有了這些積累,梁文鋒在2023年7月創(chuàng)立了深度求索(DeepSeek),要做AI大模型。"現(xiàn)在入場(chǎng),怎么跟OpenAI這樣的行業(yè)巨頭競(jìng)爭(zhēng)?" 面對(duì)質(zhì)疑,篤信“人工智能一定會(huì)改變世界”的梁文鋒沒(méi)有多做解釋。不到一年的時(shí)間,所有人就都閉嘴了,只剩下了佩服。
2024年5月,DeepSeek發(fā)布了DeepSeek-V2,憑借創(chuàng)新的模型架構(gòu)和史無(wú)前例的性?xún)r(jià)比,以"AI界的拼多多"迅速出圈。反卷大廠的梁文鋒,在AI領(lǐng)域復(fù)制了黃崢式“后來(lái)居上”的故事,并在國(guó)內(nèi)掀起打到骨折的大模型價(jià)格戰(zhàn)。
DeepSeek-V2的關(guān)鍵開(kāi)發(fā)者之一羅福莉曾在社交平臺(tái)撰文表示,“單論DeepSeek-V2模型的中文水平,是真實(shí)處在國(guó)內(nèi)外閉源模型的第一梯隊(duì)”,“外加1元/百萬(wàn)輸入Tokens的價(jià)格,只有GPT4價(jià)格的1/100,性?xún)r(jià)比之王”。這個(gè)羅福莉,就是此前傳聞小米創(chuàng)始人雷軍要開(kāi)千萬(wàn)年薪挖走的天才少女。
梁文鋒的用人之道也很有意思:不要海歸,只要本土工程師;不要老手,偏愛(ài)應(yīng)屆生;沒(méi)有KPI,全憑興趣干活。他說(shuō):“一件激動(dòng)人心的事,或許不能單純用錢(qián)衡量。就像家里買(mǎi)鋼琴,一來(lái)買(mǎi)得起,二來(lái)是因?yàn)橛幸蝗杭庇谠谏厦鎻椬鄻?lè)曲的人。”
底層技術(shù)路線(xiàn)上的顛覆,實(shí)現(xiàn)了彎道趕超
從技術(shù)原理上來(lái)說(shuō),DeepSeek的崛起,尤其是最新一代deepseek R1的成功,來(lái)自于它所采用的RL強(qiáng)化學(xué)習(xí)策略,這是它以極低的成本卻可以實(shí)現(xiàn)和GPT-4o差不多效果的根本原因。
以GPT為代表的傳統(tǒng)AI,其策略的本質(zhì)是"在人類(lèi)選擇下的猜謎游戲"——GPT們其實(shí)并不會(huì)真正思考,而是通過(guò)數(shù)據(jù)訓(xùn)練,生成一些"看似靠譜實(shí)則無(wú)法深究"的東西,比如早期繪畫(huà)AI會(huì)把人手畫(huà)出六個(gè)指頭,就是因?yàn)锳I不知道人該有幾個(gè)指頭,只是通過(guò)大量的數(shù)據(jù)訓(xùn)練,能生成一個(gè)"大概是這樣"的東西。之后再由人類(lèi)進(jìn)行篩選,把不靠譜的結(jié)果去除掉,才能得到最終的作品。
而對(duì)DeepSeek來(lái)說(shuō),它完全拋棄了這種"猜謎"的訓(xùn)練方式,轉(zhuǎn)而采用了之前在圍棋和智能駕駛領(lǐng)域常用的RL策略(強(qiáng)化學(xué)習(xí))。如果說(shuō)以前的策略是人類(lèi)告訴AI什么是對(duì)的什么是錯(cuò)的,那么RL策略,就是真正地讓AI學(xué)會(huì)認(rèn)識(shí)世界、了解事物規(guī)律,更加自主地去推理探索。
在傳統(tǒng)技術(shù)路徑下,90%的算力消耗在試錯(cuò)過(guò)程中,而Deepseek的自主學(xué)習(xí)機(jī)制能將無(wú)效訓(xùn)練降低60%。因?yàn)榈讓蛹夹g(shù)路線(xiàn)上的顛覆,deepseek R1也把運(yùn)行成本大大降低——比起硅谷動(dòng)輒數(shù)億數(shù)十億美金的投資和數(shù)萬(wàn)張顯卡的超級(jí)集群,這個(gè)國(guó)產(chǎn)大模型僅僅靠著2000多張顯卡和600萬(wàn)美元左右的成本就實(shí)現(xiàn)了近似乃至更好的效果。
對(duì)我國(guó)初創(chuàng)公司來(lái)說(shuō),更關(guān)鍵的一點(diǎn)是,RL策略對(duì)并行計(jì)算的需求較傳統(tǒng)架構(gòu)下降40%,這直接打破了堆砌算力、數(shù)據(jù)的美國(guó)式AI道路,使得國(guó)產(chǎn)顯卡和國(guó)產(chǎn)芯片有機(jī)會(huì)實(shí)現(xiàn)對(duì)英偉達(dá)等海外巨頭的替代。
說(shuō)到這里,DeepSeek的崛起,就不僅僅是技術(shù)側(cè)的意義了:一家誕生在中國(guó)的民營(yíng)公司,不超過(guò)200人的本土青年工程師團(tuán)隊(duì),繞開(kāi)了美國(guó)人所探索的“成功模式道路”,采取了創(chuàng)新的思路和開(kāi)源的方式,以極低的成本創(chuàng)造了業(yè)界矚目的成就,實(shí)現(xiàn)了彎道趕超。
作為硅谷眼中“神秘的東方力量”,Scale AI創(chuàng)始人亞歷山大·王(Alexandr Wang)評(píng)價(jià)DeepSeek道,“過(guò)去十年來(lái),美國(guó)可能一直在人工智能競(jìng)賽中領(lǐng)先于中國(guó),但DeepSeek的AI大模型發(fā)布可能會(huì)‘改變一切’。”
寫(xiě)在最后……
DeepSeek的橫空出世,讓自詡領(lǐng)先至少10年以上的META和CHAT gpt有點(diǎn)不知該何去何從了。號(hào)稱(chēng)“星球大戰(zhàn)”2.0版本,并計(jì)劃耗費(fèi)天文數(shù)字的星際之門(mén)還沒(méi)打開(kāi)好像就該關(guān)上了——美國(guó)總統(tǒng)特朗普在會(huì)議上提到DeepSeek的出現(xiàn)為美國(guó)的企業(yè)敲響了警鐘,“我們需要集中精力在競(jìng)爭(zhēng)中獲勝”。相隔一天,據(jù)外媒報(bào)道,多名美國(guó)官員稱(chēng)DeepSeek是“偷竊”,正對(duì)其展開(kāi)國(guó)家安全調(diào)查。
在除夕這天震撼世界的,還有同樣是來(lái)自杭州的宇樹(shù)科技。在央視春晚現(xiàn)場(chǎng),來(lái)自宇樹(shù)科技的人形機(jī)器人H1跳起了AI機(jī)器秧歌,還能多角度轉(zhuǎn)手絹。
這些機(jī)器人身上裝備了多套高科技設(shè)備,如高精度3D激光SLAM自主定位和導(dǎo)航、多智能體協(xié)同規(guī)劃、先進(jìn)組網(wǎng)方案和全身AI運(yùn)動(dòng)控制,可以讓他們?cè)谖枧_(tái)上走得穩(wěn)穩(wěn)當(dāng)當(dāng),動(dòng)作整齊得就像復(fù)制粘貼一樣,這些技術(shù)不僅讓他們們定位超精準(zhǔn),連接超穩(wěn)定,還能應(yīng)對(duì)各種突發(fā)狀況?梢哉f(shuō),這是人類(lèi)歷史上首次大型全AI驅(qū)動(dòng)的全自動(dòng)集群人形機(jī)器。前些年不可一世的波士頓動(dòng)力機(jī)器人,好像三下兩下,也被宇樹(shù)趕上了。
從大疆、宇樹(shù)再到石破天驚的六代機(jī)、DeepSeek,東方大國(guó)不斷涌現(xiàn)出改寫(xiě)世界技術(shù)版圖的高科技企業(yè)。讓世界目不暇接,甚至逼得某些國(guó)家要采取并不光明正大的反制措施了。
“中國(guó)必然需要有人站到技術(shù)的前沿”,梁文鋒此前接受采訪時(shí)曾表示,回望過(guò)去30多年IT浪潮,中國(guó)基本沒(méi)有參與到真正的技術(shù)創(chuàng)新里。“我們覺(jué)得現(xiàn)在最重要的是參與到全球創(chuàng)新的浪潮里去。”被外界視為理想主義者的他說(shuō),“過(guò)去很多年,中國(guó)公司習(xí)慣了別人做技術(shù)創(chuàng)新,我們拿過(guò)來(lái)做應(yīng)用變現(xiàn),但這并非一種理所當(dāng)然。這一波浪潮里,我們的出發(fā)點(diǎn),就不是趁機(jī)賺一筆,而是走到技術(shù)的前沿,去推動(dòng)整個(gè)生態(tài)發(fā)展。”
原文標(biāo)題 : 狂舞的DeepSeek、會(huì)扭秧歌的AI機(jī)器人,這個(gè)春節(jié)不一般

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車(chē)電子技術(shù)在線(xiàn)大會(huì)
-
4月30日立即下載>> 【村田汽車(chē)】汽車(chē)E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線(xiàn)下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線(xiàn)會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書(shū)】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評(píng) >> 【評(píng)選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評(píng)選
推薦專(zhuān)題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開(kāi)始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類(lèi)新物種登上歷史舞臺(tái)
- 5 國(guó)產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來(lái)商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽(yáng)光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開(kāi)成長(zhǎng)空間
- 8 地平線(xiàn)自動(dòng)駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營(yíng)收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?