DeepSeek播種,阿里云“收割”?
撰文 | 郝 鑫
編輯 | 吳先之
DeepSeek沖擊影響下,云和AI正在成為重估阿里的標尺。
2月20日,阿里發(fā)布2025財年第三季度業(yè)績報告(截至2024年12月31日止)。報告期內(nèi),阿里云實現(xiàn)營收317.42億元,同比增長13%,相比上一季度7%的增速接近翻倍。整體收入(不計來自阿里巴巴并表業(yè)務的收入)實現(xiàn)雙位數(shù)同比增長11%。調(diào)整后EBITA增長33%至31.38億。
財報顯示,該增長得益于AI相關產(chǎn)品推動的公共云收入增長,阿里云AI收入已連續(xù)六個季度三位數(shù)增長。
受云業(yè)務增長表現(xiàn),阿里在美股盤前交易中上漲10%。相關數(shù)據(jù)顯示,今年以來,阿里港股股價上漲了48.7%,一度創(chuàng)下了接近60%的漲幅。
而這背后都離不開AI和云的影子。李飛飛利用開源大模型Qwen,以不到50美元的成本復刻DeepSeek-R1模型性能。蘋果選擇與阿里通義合作,為蘋果國內(nèi)手機提供AI服務,一連串消息都獲得了市場的認可。
春節(jié)期間,DeepSeek給世界拋下了一枚重磅炸彈,也重新點燃了行業(yè)對大模型的熱情。似乎每個人都想抓住這波流量,并試圖將流量商業(yè)化變現(xiàn)。
從結(jié)果來看,在由DeepSeek引發(fā)的流量大戰(zhàn)中,贏面較大的仍是以阿里云為代表的云廠商。一方面是有穩(wěn)健的基礎設施和維護能力來接納DeepSeek-R1“難民”,另一方面也通過接入DeepSeek推理模型,完成了留存拉新的階段性任務。特別在開源領域,Qwen系列大模型仍具備競爭力,是國內(nèi)不少中小企業(yè)決策和部署模型選項。
不可否認的是DeepSeek已經(jīng)對國內(nèi)大模型行業(yè)產(chǎn)生了影響:開源的價值被肯定,大模型技術的護城河被擊,玩家加速分化和優(yōu)勝劣汰。但短期熱度過后,仍需思考“推理”模型落地場景產(chǎn)生的實用價值。
Qwen與DeepSeek的距離
阿里財報會上提到,“春節(jié)以來,推理需求呈爆炸性增長”,客戶對AI相關產(chǎn)品的新需求約有60%-70%用于推理。
未來式智能CEO楊勁松對上面的數(shù)字有著清晰的感知,他回憶在春節(jié)期間,至少有一半的老客戶咨詢在DeepSeek,潛在和尚在溝通的新客戶也有二三十個。此前,這些人大部分是Qwen或智譜的客戶。
楊勁松介紹來咨詢的客戶大致分為兩類,一類是之前就在使用大模型的客戶,他們比較關注新模型的性能有哪些提升,以及自身能否部署和應用。第二類是尚未下決策的群體,開源正在改變他們的認知,意味著未來或許不需要花錢去找模型廠商采購。
盡管去年閉源大模型打到了“骨折價”,但動輒百萬元級別的大模型對許多中小企業(yè)來說,仍是奢望。受困于預算,大模型決策鏈條十分長,涉及了選擇哪家大模型,配套何種資源以及怎么去驗證大模型價值等。
開源的優(yōu)勢凸顯出來,能夠以輕便的模式跑模型,體驗性能的同時得到結(jié)果。目前,在開發(fā)者和To B客戶中,通義千問的32B和72B最受歡迎。開源版的Qwen同樣在海外得到了認可,官方數(shù)據(jù)顯示,海內(nèi)外開源社區(qū)中Qwen的衍生模型數(shù)量已突破9萬,超越Llama系列衍生模型,通義千問Qwen成長為世界最大的生成式語言模型族群。
簡單算一筆賬,假設使用開源版的通義千問模型搭建一個AI應用項目。模型是免費的,大頭支出就變成了硬件,剩下少部分是使用MaaS平臺工具和構(gòu)建應用的服務費用。預估下來,總體成本預算能控制在百萬以內(nèi)。
DeepSeek帶著新推理模型殺回了開源領域,風頭一下子蓋過了Qwen和Llama。截至目前,DeepSeek相繼開源了671B參數(shù)的MoE模型“DeepSeek-V3”,對標OpenAI o1的“DeepSeek-R1”和代碼模型“DeepSeek Coder”等幾款重要的模型。
當在開源的戰(zhàn)場狹路相逢,Qwen和DeepSeek能否構(gòu)成直接競爭?
楊勁松認為“暫時影響不太大”,Qwen在開源生態(tài)的優(yōu)勢仍十分明顯。
目前,通義千問就像是阿里“全家桶”,實現(xiàn)了“全尺寸、全模態(tài)、多場景”開源。包含了長文本、代碼生成、多模態(tài)、推理等多款模型,尺寸上也從3B跨越到72B,覆蓋了企業(yè)日常知識問答、客服對話、代碼生成、數(shù)據(jù)分析等常用場景。據(jù)悉,基于Qwen2.5-Max的深度推理模型也即將上線。正是這種“全”,給了用戶更多靈活的選擇。
國內(nèi)阿里是較早選擇開源的,Qwen系列模型就是以開源起家。當前,基于模型底座已經(jīng)積累起了很多開發(fā)者用戶、工具,生長出了一些應用產(chǎn)品。成熟的生態(tài)會給予用戶便利性,促使其繼續(xù)使用千問模型。
“一定程度上要取決于DeepSeek后期資源分配,在團隊規(guī)模有限的情況下,是專注模型研發(fā)還是花費一定精力去維護開源生態(tài)”,行業(yè)中有部分人認為DeepSeek的重心依然在AGI研究上。
如果DeepSeek在開源上一直能保持領先,不排除將演變?yōu)樯鷳B(tài)系統(tǒng)之爭。不過,DeepSeek和Qwen現(xiàn)在更偏向互為補充。一部分小尺寸DeepSeek-R1開源版本,就是基于Qwen模型蒸餾而來。
云廠商“收割”DS流量
高漲的情緒摻雜著些許沖動,一夜之間,比DeepSeek更火的是“接入DeepSeek”。
“不管怎么樣,本地來一套DeepSeek,讓我們能夠向上匯報”,大到國央企和政府部分,小到大廠、中小企業(yè)和個人開發(fā)者都想做第一批“吃螃蟹的人”。
現(xiàn)實的問題是,在開源社區(qū)只能部署和跑得通R1蒸餾后的小模型,32B、70B小尺寸模型效果并不是很驚艷。
“接入”DeepSeek看上去很熱鬧,好像每家都在宣傳,但其實大部分還是量化后的版本。要部署“滿血版”6710億參數(shù)的DeepSeek V3/R1,既要求得有硬件層面做推理優(yōu)化的能力,還得扛得住經(jīng)濟成本。
以往一個新模型出來,因為時間差的原因,總會誕生一批賣API的人,但這回屬實讓一批人望而卻步。有人大致推算,要把6710B拉滿,至少需要1000G內(nèi)存的卡,16臺八卡A100的機器,即使定價與DeepSeek漲價后價格持平,也是虧錢的狀態(tài)。與此同時,還得承受流量涌進后服務器的壓力和用戶消耗成本。
沒有誰比云廠商更熟悉這套玩法,嗅到流量味道的云廠商們伺機而動了起來,相繼官宣MaaS平臺接入“滿血版”的R1。送token還限時免費,恢復原價后的模型輸入、輸出價格也低于DeepSeek官方價格。
云廠商不靠賣API賺錢,最終獲益的還是整套云計算基建規(guī);笮б。對阿里云們來說,搶奪AI時代流量入口才更重要,云上多模調(diào)用已經(jīng)是大趨勢,以更開放的心態(tài)才能吸引來更多用戶。一旦調(diào)用R1的API鎖定在一家云上,后期服務器、存儲、構(gòu)建應用等持續(xù)消費也將留在該廠商上。
對開發(fā)者和企業(yè)來說,調(diào)用哪家的API沒有差別,最終還是要落到價格上。在沒有明顯效果差距下,傾向于哪家價格便宜用哪家。于是,大廠的價格優(yōu)勢就很明顯。
結(jié)果也是顯而易見,阿里云們接住了這波流量,token調(diào)用量、股價和市值隨之上漲。
DeepSeek或許讓阿里云等廠商愈發(fā)明確了生態(tài)站位。也許未來,國內(nèi)外還將會出現(xiàn)性能優(yōu)越的模型。這其中不變的是對云基礎設施、釋放模型能力和普惠的需求。
財報會上,阿里也明確了AI未來三年內(nèi)的投資方向,強調(diào)“重投入”。
投資AI基礎設施,計劃在未來三年內(nèi)對云和AI基礎設施的投資將超過過去十年的總和;大幅增加對AI基礎模型的研發(fā)投入,以保持技術領先地位,并推動AI原生應用的發(fā)展;增加對AI應用研發(fā)和計算能力的投資,并將AI深度整合到電商和互聯(lián)網(wǎng)平臺業(yè)務中,抓住AI時代的新增長機會。
短期熱度與長期價值
短期的熱度屬于云廠商,風暴中心的DeepSeek已經(jīng)move on,下周將陸續(xù)開源五個代碼庫。
把視線拉遠,DeepSeek的長期價值應當回歸到,推理模型究竟能解決什么問題。“幾百家接入DeepSeek公司,可能自己也沒想明白到底能干什么”。
楊勁松觀察到,整個行業(yè)仍處于技術亢奮狀態(tài),還未達到R1大規(guī)模應用落地的階段。結(jié)合國外的發(fā)展,還是有幾個方向值得探索。
行業(yè)普遍看好的方向之一是AI Coding。海外Cursor等AI編程產(chǎn)品大火,基本確立了Claude 3.5 Sonnet加上o1的組合,即Claude 3.5 Sonnet負責生成代碼,再用o1思維鏈去推理證明使用方式。這套組合之前在國內(nèi)沒有平替,現(xiàn)在DeepSeek有了自己代碼+推理組合。這意味著有了構(gòu)建一套Coding Agent的可能性。
“基于R1基座,通過強化學習的方式在垂直領域達到媲美人或超越人的能力,這是我覺得未來應用方向”,楊勁松表示道。
之前模型應用的路徑是,先有基模,然后收集數(shù)據(jù),再通過微調(diào)訓練調(diào)整模型,來預測下一個token能力。但在實際業(yè)務場景中,采用行業(yè)數(shù)據(jù)和機器學習訓練出的通用模型能力效果差強人意。
現(xiàn)在有了推理模型以后,就可以把行業(yè)專家在特定領域和工作流的最佳實踐,通過強化學習方式喂給推理模型。這樣一來,它就可以熟悉企業(yè)內(nèi)部流程,掌握業(yè)務邏輯,做到像一位專家一樣去工作。楊勁松認為,R1真正的價值在于,可以上升到?jīng)Q策層面,完成垂直領域的任務,且達到不錯的效果。
例如在電力場景,日常存在許多分析電網(wǎng)圖譜的工作。它要基于內(nèi)部規(guī)則做推導,再去進行決策。現(xiàn)在接入R1推理模型,并配備一些行業(yè)知識后,一定程度上就可以模擬電力專家完成電網(wǎng)調(diào)度、專改公等非常專業(yè)的任務。
OpenAI已經(jīng)在探索把推理功能落地到場景中。其由o3大模型支持的“Deep Research”功能,可以從互聯(lián)網(wǎng)上收集信息,并將其合成為簡明的報告。OpenAI聲稱,“只需數(shù)十分鐘就能完成人類需要數(shù)小時才能完成的工作”。
這本質(zhì)上是復制行業(yè)分析師和咨詢顧問的思考鏈條。使用模型還原分析過程,過程中調(diào)用搜索引擎、圖表等工具。圍繞一個研究主題,先推理、檢索再進行深度分析,其生成的報告基本可以達到中級行業(yè)分析師的水平。
目前,國內(nèi)大廠已經(jīng)開始逐漸上線類似的“深度搜索”功能。要大規(guī)模地落地生產(chǎn)力場景,仍需時間驗證。
原文標題 : DeepSeek播種,阿里云“收割”?

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關稅,能否乘機器人東風翻身?