国产白嫩美女在线观看,一二三四区高清在线免费观看 ,自慰喷白浆的圖文並茂

狂舞的DeepSeek、會扭秧歌的AI機器人，這個春節(jié)不一般

2025-02-06 13:35

有點數(shù)

關(guān)注

有點數(shù)·數(shù)字經(jīng)濟(jì)工作室原創(chuàng)

作者 | 有叔

微信ID | yds_sh

在辭舊迎新的蛇年春節(jié)假期，橫空出世的DeepSeek金蛇狂舞，AI機器人在春晚上扭起了秧歌，這些領(lǐng)先行業(yè)的“神秘東方力量”，給全球科技界帶來了“億點點”震撼。

憑一己之力，打壓了AI科技巨頭的估值

DeepSeek（深度求索）是量化巨頭幻方量化旗下大模型公司，1月20日，該公司正式發(fā)布推理大模型DeepSeek-R1。1月27日，DeepSeek應(yīng)用登頂蘋果中國地區(qū)和美國地區(qū)應(yīng)用商店免費APP下載排行榜。被DeepSeek壓在身后的，包括了OpenAI旗下的ChatGPT以及Google Gemini等AI產(chǎn)品。這是第一次，有中國科技產(chǎn)品APP實現(xiàn)雙榜登頂。

更震撼的還在后面，美國時間1月27日，英偉達(dá)（Nasdaq：NVDA）股價暴跌16.86%收于每股118.58美元，跌至過去10月以來的最低點；總市值2.90萬億美元，一日蒸發(fā)5900億美元（約合人民幣4.28萬億元），創(chuàng)史上最大單日個股市值蒸發(fā)紀(jì)錄。在英偉達(dá)的帶領(lǐng)下，美股半導(dǎo)體芯片板塊集體受挫，甲骨文下跌13.78%，超微電腦下跌12.49%，芯片制造商博通下跌17.4%，臺積電跌13%。

這些科技巨頭為何會在股市被“掀桌”呢？這是因為DeepSeek用開源的方式、更低的成本實現(xiàn)了高性能的大模型，從而引發(fā)了資本市場對AI科技巨頭估值的擔(dān)憂。

先說開源，由微軟、OpenAI、英偉達(dá)等公司構(gòu)筑出的“美式AI生態(tài)有機體”，商業(yè)化的前提是“不能開源”——要通過AI模型本身收費或者將其納入付費產(chǎn)品之中完成商業(yè)閉環(huán)。而DeepSeek-R1則是一款開源推理大模型，基于相關(guān)的許可協(xié)議，DeepSeek-R1允許全球開發(fā)者自由地修改、使用、分發(fā)模型，甚至還可以進(jìn)行衍生開發(fā)和商用。

除了商業(yè)化方面的考量，DeepSeek開源帶給OpenAI的另一個巨大挑戰(zhàn)是，當(dāng)開源產(chǎn)品的“能力”和閉源產(chǎn)品接近甚至反超后者時，對閉源產(chǎn)品的沖擊將是巨大的。DeepSeek下載熱度的激增，背后的核心原因之一正是開源：用戶可以在自己的服務(wù)器或云端免費部署DeepSeek-R1，且大幅降低（甚至不需要）API調(diào)用費用。

DeepSeek第二個驚人之處，是其極低的預(yù)訓(xùn)練成本。性能比肩GPT-4o的DeepSeek-V3，投入研發(fā)費用為558萬美元，訓(xùn)練成本不到GPT-4o的1/20，且只用了2048張H100的GPU集群，用時僅53天。在同等水平下，哪怕是全球AI第一梯隊的頭部公司，至少也要用到1.6萬張以上的GPU進(jìn)行訓(xùn)練。

大幅降低了技術(shù)成本的DeepSeek，對算力市場形成了強大的沖擊。它背后的那個男人，也來到了聚光燈下。

量化私募大佬，一轉(zhuǎn)身大模型就掀起了價格戰(zhàn)

2025年1月20日，AI初創(chuàng)公司深度求索創(chuàng)始人梁文鋒受邀出席相關(guān)部門座談會，并做了相關(guān)發(fā)言。國內(nèi)做AI通用大模型的大廠不下五個，但只邀請了梁文鋒作為AI領(lǐng)域的企業(yè)家代表。而就在這一天，發(fā)布了DeepSeek-R1，梁文鋒也隨即被社會大眾所關(guān)注。

1985年，梁文鋒出生在廣東湛江吳川市的一個普通家庭，父母都是小學(xué)語文老師。這個來自四線城市的少年，對數(shù)學(xué)特別感興趣，初中時期就學(xué)完了高中數(shù)學(xué)，甚至開始學(xué)大學(xué)的數(shù)學(xué)。

2002年，17歲的梁文鋒以全校第一的成績考上浙江大學(xué)本科電子信息工程專業(yè)，于2007年考上浙江大學(xué)信息與通信工程專業(yè)研究生。在大學(xué)期間，他遇到了改變自己一生的兩件事：愛上了機器學(xué)習(xí)，迷上了量化交易。

畢業(yè)之后，梁文鋒與同學(xué)一起開始積累市場行情數(shù)據(jù)和探索全自動量化交易。2015年，當(dāng)其他人還在為股市的跌宕起伏心驚膽戰(zhàn)時，30歲的梁文鋒在杭州創(chuàng)立了幻方科技，投身于全自動量化交易，立志成為世界頂級的量化對沖基金。

盡管當(dāng)時公司只有10張GPU顯卡，但不久之后的2016年10月，幻方量化推出第一個AI模型，第一份由深度學(xué)習(xí)生成的交易倉位上線執(zhí)行。到2017年底，幾乎所有的量化策略都采用AI模型計算。有了AI加持助力，用了4年時間，公司就做到了百億規(guī)模，又用2年時間突破千億大關(guān)。

從一開始，投資賺錢就不是梁文鋒的唯一目的，反而是賺到了足夠多的錢，才能更好地去研究人工智能。2019年，幻方量化成立AI公司，其自研的深度學(xué)習(xí)訓(xùn)練平臺“螢火一號”總投資近2億元，搭載了1100塊GPU；兩年后，“螢火二號”的投入增加到10億元，搭載了約1萬張英偉達(dá)A100顯卡。通常認(rèn)為，1萬枚英偉達(dá)A100芯片是做自訓(xùn)大模型的算力門檻，而單從算力角度看，幻方甚至比很多大廠都更早拿到了做ChatGPT的入場券。

有了這些積累，梁文鋒在2023年7月創(chuàng)立了深度求索（DeepSeek），要做AI大模型。"現(xiàn)在入場，怎么跟OpenAI這樣的行業(yè)巨頭競爭？" 面對質(zhì)疑，篤信“人工智能一定會改變世界”的梁文鋒沒有多做解釋。不到一年的時間，所有人就都閉嘴了，只剩下了佩服。

2024年5月，DeepSeek發(fā)布了DeepSeek-V2，憑借創(chuàng)新的模型架構(gòu)和史無前例的性價比，以"AI界的拼多多"迅速出圈。反卷大廠的梁文鋒，在AI領(lǐng)域復(fù)制了黃崢式“后來居上”的故事，并在國內(nèi)掀起打到骨折的大模型價格戰(zhàn)。

DeepSeek-V2的關(guān)鍵開發(fā)者之一羅福莉曾在社交平臺撰文表示，“單論DeepSeek-V2模型的中文水平，是真實處在國內(nèi)外閉源模型的第一梯隊”，“外加1元/百萬輸入Tokens的價格，只有GPT4價格的1/100，性價比之王”。這個羅福莉，就是此前傳聞小米創(chuàng)始人雷軍要開千萬年薪挖走的天才少女。

梁文鋒的用人之道也很有意思：不要海歸，只要本土工程師；不要老手，偏愛應(yīng)屆生；沒有KPI，全憑興趣干活。他說：“一件激動人心的事，或許不能單純用錢衡量。就像家里買鋼琴，一來買得起，二來是因為有一群急于在上面彈奏樂曲的人。”

底層技術(shù)路線上的顛覆，實現(xiàn)了彎道趕超

從技術(shù)原理上來說，DeepSeek的崛起，尤其是最新一代deepseek R1的成功，來自于它所采用的RL強化學(xué)習(xí)策略，這是它以極低的成本卻可以實現(xiàn)和GPT-4o差不多效果的根本原因。

以GPT為代表的傳統(tǒng)AI，其策略的本質(zhì)是"在人類選擇下的猜謎游戲"——GPT們其實并不會真正思考，而是通過數(shù)據(jù)訓(xùn)練，生成一些"看似靠譜實則無法深究"的東西，比如早期繪畫AI會把人手畫出六個指頭，就是因為AI不知道人該有幾個指頭，只是通過大量的數(shù)據(jù)訓(xùn)練，能生成一個"大概是這樣"的東西。之后再由人類進(jìn)行篩選，把不靠譜的結(jié)果去除掉，才能得到最終的作品。

而對DeepSeek來說，它完全拋棄了這種"猜謎"的訓(xùn)練方式，轉(zhuǎn)而采用了之前在圍棋和智能駕駛領(lǐng)域常用的RL策略（強化學(xué)習(xí)）。如果說以前的策略是人類告訴AI什么是對的什么是錯的，那么RL策略，就是真正地讓AI學(xué)會認(rèn)識世界、了解事物規(guī)律，更加自主地去推理探索。

在傳統(tǒng)技術(shù)路徑下，90%的算力消耗在試錯過程中，而Deepseek的自主學(xué)習(xí)機制能將無效訓(xùn)練降低60%。因為底層技術(shù)路線上的顛覆，deepseek R1也把運行成本大大降低——比起硅谷動輒數(shù)億數(shù)十億美金的投資和數(shù)萬張顯卡的超級集群，這個國產(chǎn)大模型僅僅靠著2000多張顯卡和600萬美元左右的成本就實現(xiàn)了近似乃至更好的效果。

對我國初創(chuàng)公司來說，更關(guān)鍵的一點是，RL策略對并行計算的需求較傳統(tǒng)架構(gòu)下降40%，這直接打破了堆砌算力、數(shù)據(jù)的美國式AI道路，使得國產(chǎn)顯卡和國產(chǎn)芯片有機會實現(xiàn)對英偉達(dá)等海外巨頭的替代。

說到這里，DeepSeek的崛起，就不僅僅是技術(shù)側(cè)的意義了：一家誕生在中國的民營公司，不超過200人的本土青年工程師團(tuán)隊，繞開了美國人所探索的“成功模式道路”，采取了創(chuàng)新的思路和開源的方式，以極低的成本創(chuàng)造了業(yè)界矚目的成就，實現(xiàn)了彎道趕超。

作為硅谷眼中“神秘的東方力量”，Scale AI創(chuàng)始人亞歷山大·王（Alexandr Wang）評價DeepSeek道，“過去十年來，美國可能一直在人工智能競賽中領(lǐng)先于中國，但DeepSeek的AI大模型發(fā)布可能會‘改變一切’。”

寫在最后……

DeepSeek的橫空出世，讓自詡領(lǐng)先至少10年以上的META和CHAT gpt有點不知該何去何從了。號稱“星球大戰(zhàn)”2.0版本，并計劃耗費天文數(shù)字的星際之門還沒打開好像就該關(guān)上了——美國總統(tǒng)特朗普在會議上提到DeepSeek的出現(xiàn)為美國的企業(yè)敲響了警鐘，“我們需要集中精力在競爭中獲勝”。相隔一天，據(jù)外媒報道，多名美國官員稱DeepSeek是“偷竊”，正對其展開國家安全調(diào)查。

在除夕這天震撼世界的，還有同樣是來自杭州的宇樹科技。在央視春晚現(xiàn)場，來自宇樹科技的人形機器人H1跳起了AI機器秧歌，還能多角度轉(zhuǎn)手絹。

這些機器人身上裝備了多套高科技設(shè)備，如高精度3D激光SLAM自主定位和導(dǎo)航、多智能體協(xié)同規(guī)劃、先進(jìn)組網(wǎng)方案和全身AI運動控制，可以讓他們在舞臺上走得穩(wěn)穩(wěn)當(dāng)當(dāng)，動作整齊得就像復(fù)制粘貼一樣，這些技術(shù)不僅讓他們們定位超精準(zhǔn)，連接超穩(wěn)定，還能應(yīng)對各種突發(fā)狀況�？梢哉f，這是人類歷史上首次大型全AI驅(qū)動的全自動集群人形機器。前些年不可一世的波士頓動力機器人，好像三下兩下，也被宇樹趕上了。

從大疆、宇樹再到石破天驚的六代機、DeepSeek，東方大國不斷涌現(xiàn)出改寫世界技術(shù)版圖的高科技企業(yè)。讓世界目不暇接，甚至逼得某些國家要采取并不光明正大的反制措施了。

“中國必然需要有人站到技術(shù)的前沿”，梁文鋒此前接受采訪時曾表示，回望過去30多年IT浪潮，中國基本沒有參與到真正的技術(shù)創(chuàng)新里。“我們覺得現(xiàn)在最重要的是參與到全球創(chuàng)新的浪潮里去。”被外界視為理想主義者的他說，“過去很多年，中國公司習(xí)慣了別人做技術(shù)創(chuàng)新，我們拿過來做應(yīng)用變現(xiàn)，但這并非一種理所當(dāng)然。這一波浪潮里，我們的出發(fā)點，就不是趁機賺一筆，而是走到技術(shù)的前沿，去推動整個生態(tài)發(fā)展。”

原文標(biāo)題 : 狂舞的DeepSeek、會扭秧歌的AI機器人，這個春節(jié)不一般