91在线网站,最新无码国模国产在线,GOGO中日韩人体无码

DeepSeek熱潮將在預(yù)訓練、后訓練（二次訓練）和推理三大細分市場都帶來巨大改變。

文｜周享玥

編｜趙艷秋

DeepSeek狂潮下，2025年的智算市場正在發(fā)生巨變。

業(yè)界觀察，不同于DeepSeek剛出來時，一些人士對于“其算法優(yōu)化可能導(dǎo)致智算市場需求下降”的猜測，在經(jīng)歷了連續(xù)幾周的發(fā)酵后，市場上的算力需求正呈現(xiàn)短期內(nèi)的快速爆發(fā)趨勢。

“最近兩個禮拜，來找我們咨詢購買能夠完整運行671B DeepSeek R1模型的AI服務(wù)器的客戶數(shù)正在直線上升。”2月13日，在IDC與浪潮信息聯(lián)合發(fā)布《2025年中國人工智能計算力發(fā)展評估報告》（簡稱《報告》）的現(xiàn)場，浪潮信息高級副總裁劉軍告訴數(shù)智前線。

在這次《報告》中，市場分析機構(gòu)IDC和智算Infra大廠浪潮信息一起，對DeepSeek給智算市場帶來的變化、當下最新的智算市場格局進行了深入解讀，并分享了今年智算市場發(fā)展的一些重要趨勢。

DeepSeek狂潮下，2025年智算市場如何變？

DeepSeek是條鯰魚，正在將市場重新調(diào)動起來。

C端用戶熱情高漲，即便是老人、小孩兒，知道DeepSeek的也不在少數(shù)，B端和G端的應(yīng)用探索大幅提速，每天都有新一波企業(yè)和機構(gòu)官宣接入DeepSeek。

算力需求在短期內(nèi)激增。春節(jié)后第一周，國內(nèi)外芯片廠商都在緊鑼密鼓加緊適配工作，據(jù)行業(yè)人士預(yù)測，推理端的適配將會優(yōu)先完成，訓練端的工作則將持續(xù)一段時間。服務(wù)器廠商們也在最近接到不少咨詢和采購訂單。

而從中長期來看，多位行業(yè)人士均告訴數(shù)智前線，這波DeepSeek熱潮將有望在預(yù)訓練、后訓練（二次訓練）和推理三大細分市場都帶來巨大改變，帶動智算市場的進一步發(fā)展。

在預(yù)訓練端，去年市場上一度彌漫著一股悲觀情緒，Scaling Law（規(guī)模法則）被懷疑即將失效，一些大模型企業(yè)也逐漸放棄預(yù)訓練。但隨著DeepSeek的故事范本生效，這種趨勢即將扭轉(zhuǎn)，一些玩家可能有信心重返戰(zhàn)場。

“如果DeepSeek通過算法優(yōu)化，用一萬張卡搞出了別人十萬張卡的模型，就會有人想，我用十萬張卡，用DeepSeek的這種工程模式和技術(shù)架構(gòu)會訓練出什么。”IDC中國副總裁周震剛說，這對全球所有大模型玩家，都是一種激勵。

2月13日，OpenAI首席執(zhí)行官薩姆·奧爾特曼在社交平臺X上公布，OpenAI將在未來幾個月內(nèi)推出名為GPT-5的模型，該模型將整合OpenAI的大量技術(shù)。幾天后的2月18日，馬斯克正式發(fā)布了Grok 3大模型。

而在后訓練端，DeepSeek帶來的效率提升，正在讓這個市場被加強�！秷蟾妗凤@示，目前Scaling Law正在從預(yù)訓練擴展到后訓練和推理階段，基于強化學習、思維鏈等算法創(chuàng)新在后訓練和推理階段更多的算力投入，可以進一步大幅提升大模型的深度思考能力。

“Hugging Face上，最近每天都有基于DeepSeek去做微調(diào)、蒸餾出來的各種新版本出來。”周震剛舉例說，這將對整個智算市場產(chǎn)生巨大推動。

推理端，則被業(yè)界認為是一個極具潛力的市場。“DeepSeek相當于瓦特時刻。瓦特把蒸汽機改良之后，實現(xiàn)了一個穩(wěn)定的動力輸出，蒸汽機得以進入各個行業(yè)。”一位行業(yè)人士說，“大模型就是蒸汽機，被改良后，可以進入各行各業(yè)。”

“DeepSeek點燃了企業(yè)客戶對于大模型在企業(yè)內(nèi)部做業(yè)務(wù)部署和業(yè)務(wù)結(jié)合的熱情，客戶大量嘗鮮，經(jīng)歷自我試用PoC階段后，就會思考如何在業(yè)務(wù)場景中實現(xiàn)更加批量的部署和應(yīng)用。”劉軍告訴數(shù)智前線，他們預(yù)計，后面一輪的推理算力采購需求，會比這一輪的采購量來得更大，持續(xù)時間更久。

《報告》中也對此做了總結(jié)——基于杰文斯悖論的現(xiàn)象表明，DeepSeek帶來的算法效率的提升并未抑制算力需求，反而因更多的用戶和場景的加入，推動大模型普及與應(yīng)用落地，重構(gòu)產(chǎn)業(yè)創(chuàng)新范式，帶動數(shù)據(jù)中心、邊緣及端側(cè)算力建設(shè)。

數(shù)據(jù)顯示，2024年中國人工智能算力市場規(guī)模達190億美元，2025年將達到259億美元，同比增長36.2%，2028年還將進一步增加至552億美元。

智算服務(wù)市場也將高速增長。2024年，中國智算服務(wù)市場整體規(guī)模已達50億美元，到2028年將增至266.91美元，2023-2028年五年年復(fù)合增長率為57.3%

其中，智算集成服務(wù)市場（即私有化部署市場）及GenAI IaaS市場是未來重要的兩個增量市場，五年年復(fù)合增長率分別達到73%和79.8%，預(yù)計至2028年智算集成服務(wù)市場規(guī)模占比可達47%，GenAI IaaS市場規(guī)模占比達48%。

從追求量，到追求一個更高效的系統(tǒng)

《報告》中另外一個值得業(yè)界關(guān)注的關(guān)鍵點是，要想解決大模型落地過程中高性能算力供不應(yīng)求及算力利用率低等問題，不止要“擴容”，還得“提效”。

擴容很好理解，即提升算力供給能力。在這一點上，去年，業(yè)界已經(jīng)興起過一波智算熱潮，各地智算中心建設(shè)熱情高漲，涌現(xiàn)出了不少智算大單。據(jù)數(shù)智前線不完全統(tǒng)計，2024年的公開招投標市場，涌現(xiàn)出了超460個智算中心相關(guān)項目，其中，億元以上大單至少有62個。

而從整體市場來看，《報告》預(yù)計，2023至2028年，中國智能算力規(guī)模和通用算力規(guī)模的五年年復(fù)合增長率將分別達46.2%和18.8%，較上一版本預(yù)期值33.9%和16.6%有顯著提升。

而“提效”方面，除了降低算力成本，也是為了降低能耗，這對于大模型能否落地、能否跑通商業(yè)閉環(huán)，至關(guān)重要。

《報告》中提出了“提效”的四大關(guān)鍵舉措。

第一，以用定建，以應(yīng)用為導(dǎo)向，進行AI基礎(chǔ)設(shè)施建設(shè)規(guī)劃，避免資源浪費。這不僅適用于企業(yè)私有化部署自己的人工智能基礎(chǔ)設(shè)施，也十分契合于當下的智算中心建設(shè)。

此前，不少智算中心都存在利用率不高的問題，從去年開始，一些智算中心在規(guī)劃初期，已經(jīng)主要考慮各地的產(chǎn)業(yè)結(jié)構(gòu)，以應(yīng)用為導(dǎo)向來進行資源規(guī)劃。比如不同的地方，可能有制造、動漫、機器人、無人智駕、低空經(jīng)濟等不同產(chǎn)業(yè)，它們對智算規(guī)模的需求不盡相同，不同芯片之間的配比也有可能不同。

最近幾周，全國各地的多個智算中心都在官宣DeepSeek的部署上線，如河南空港智算中心、無錫太湖億芯智算、南京智算中心等。DeepSeek帶動的應(yīng)用潮，有可能給智算中心帶來新機會。

“但這也需要做出不小努力，不是簡單說跑個DeepSeek的API上去就可以了。”劉軍告訴數(shù)智前線，行業(yè)企業(yè)要將AI變成生產(chǎn)力，一定要和它自己的行業(yè)和業(yè)務(wù)數(shù)據(jù)去結(jié)合，而這個過程中，需要大量的工具和服務(wù)來進行針對性的優(yōu)化，“比如人家用了一下發(fā)現(xiàn)吐一個字要兩秒鐘，就很難接受。”

第二，提升模算效率，降低算力開銷。在這一點上，DeepSeek做了一個很好的示范。其通過創(chuàng)新性融合FP8、MLA（多頭潛在注意力）和MoE（混合專家）架構(gòu)，大幅提升了性能和效率。

其中的一些思路，也是業(yè)界此前在大模型的發(fā)展中遇到困難后，所共同去探索的方向。

“去年開始，大家發(fā)現(xiàn)，基于Dense架構(gòu)的模型，再往前去演化到要訓練一個超過五千億、一萬億參數(shù)模型時，所需的算力、時間、數(shù)據(jù)量，都是當前技術(shù)條件下實現(xiàn)不了的。“劉軍回憶，他們做過一個評估，這種情況下，需要20萬張卡訓練一年，才能把一個萬億的Dense模型高質(zhì)量訓練出來。

為此，從去年開始，業(yè)界就已經(jīng)不約而同轉(zhuǎn)向探索以MoE的方式，通過更高效算力投資的方式來實現(xiàn)更高質(zhì)量的模型。比如DeepSeek從V2開始就采用的MoE架構(gòu)，海外的Mistral此前也曾發(fā)布MoE架構(gòu)模型。

去年5月，浪潮信息發(fā)布的源2.0-M32，同樣采用了MoE的思路，通過提出和采用“基于注意力機制的門控網(wǎng)絡(luò)”技術(shù)，構(gòu)建包含32個專家的混合專家模型，大幅提升模型算力效率，單Token下訓練和推理所需的算力資源僅為Llama-70B的1/19。

“業(yè)界此前已經(jīng)在做類似工作，但DeepSeek給了我們更加明確的信號。”劉軍說，”下一階段，大家會從原來單純追求量的增長，買了多少卡，變成追求如何變成一個更高效的系統(tǒng)。”

第三，優(yōu)化算力基礎(chǔ)設(shè)施架構(gòu)。如采用先進的計算架構(gòu)，提升單計算節(jié)點性能，提高計算效率。優(yōu)化內(nèi)存層次結(jié)構(gòu)，減少數(shù)據(jù)傳輸延遲，增強數(shù)據(jù)處理速度。利用智能調(diào)度算法合理分配計算任務(wù)，優(yōu)化集群管理方面，確保資源高效利用。

第四，增強數(shù)據(jù)支持，減少無效計算。比如可以通過建立高質(zhì)量的數(shù)據(jù)集，并構(gòu)建統(tǒng)一的數(shù)據(jù)存儲和訪問接口，簡化數(shù)據(jù)流動與共享，為AI模型訓練提供強有力的支持。

《報告》也顯示，未來18個月內(nèi)，為了將大模型引入生產(chǎn)，除了硬件的升級會是企業(yè)的首要投資目標外，軟件和服務(wù)方面的支出也會是企業(yè)生成式AI項目的主要支出方向。

“2024年開始，用戶在軟件方面的投資增長越來越快，隨著DeepSeek帶來的應(yīng)用嘗鮮潮的持續(xù)奔騰，相應(yīng)的軟件和服務(wù)、定制化解決方案的開發(fā)會越來越多。”IDC中國副總裁周震剛說。

在這種背景下，客戶需要更全�；闹С�。針對這些需求，浪潮信息目前已提供全鏈條、全棧化的人工智能技術(shù)服務(wù)，從AI server計算的硬件、“源”大模型、AI station算力調(diào)度平臺到EPAI大模型落地工具。

推理市場爆發(fā)，2028年推理工作負載占比將達73%

《報告》中還提出一個重要的趨勢，推理算力有望迎來大爆發(fā)，2025年推理的工作負載占比將達到67%。“當前我們接到的所有購買需求，幾乎都是推理的。”浪潮信息高級副總裁劉軍告訴數(shù)智前線。

目前42%的中國企業(yè)已開始進行大模型的初步測試和重點概念驗證，17%的企業(yè)已將技術(shù)引入生產(chǎn)階段，并應(yīng)用于實際業(yè)務(wù)中。

與之相對應(yīng)的是，2024年，國內(nèi)推理與訓練的工作負載占比已分別達到65%和35%�！秷蟾妗奉A(yù)計，到2028年，推理工作負載占比還將進一步達到73%，遠超訓練算力27%的占比。

面對這一趨勢，公有云市場的各云計算大廠和運營商們都已摩拳擦掌，火速宣布支持DeepSeek模型調(diào)用或部署，并卷起價格戰(zhàn)，爭奪市場。

而在私有云或者說私有化部署方面，業(yè)界觀察，這一市場預(yù)計將成為推動推理算力增長的一股重要力量。“企業(yè)將要建設(shè)自己的小型智算中心，部署1~10臺服務(wù)器（百卡之內(nèi)），或10來20臺服務(wù)器（百卡規(guī)模）。”一位智算領(lǐng)域人士表示。

劉軍也告訴數(shù)智前線，1~20臺的區(qū)間，會是企業(yè)客戶未來一段時間采購私有化算力比較適合的規(guī)模。

“但這應(yīng)該會經(jīng)歷一個過程，大家不會特別盲目，一上來就不顧一切，上好多機器。”劉軍說，在早期，企業(yè)應(yīng)該會先購買一定數(shù)量的AI服務(wù)器回去構(gòu)建環(huán)境，去針對自己的業(yè)務(wù)開展PoC，驗證對自己的業(yè)務(wù)很有幫助后，才會上一個比較大的量。

IDC副總裁周震剛則預(yù)測，在這種背景下，開源+一體機的模式，“很可能是未來一段時間內(nèi)一個非常爆發(fā)性的需求。”

“過去幾年這種需求相對較少，因為一體機做推理還可以，做訓練可能沒有那么大的算力，而推理又可以直接通過service解決，也不一定本地部署這么一個推理機。但DeepSeek出來后，市場上對一體機的需求在大幅度上升。最近有很多企業(yè)都在跟我們溝通，希望了解一下這個市場規(guī)模是什么樣的。”周震剛告訴數(shù)智前線。

浪潮信息2月11日剛推出的元腦R1推理服務(wù)器，也在最近受到不少企業(yè)關(guān)注。據(jù)悉，該產(chǎn)品通過系統(tǒng)創(chuàng)新和軟硬協(xié)同優(yōu)化，單機即可部署運行DeepSeek R1 671B模型。

“為什么要強調(diào)單機就能把它跑下來？因為現(xiàn)在有好多方案是比較麻煩的，模型尺寸大了后，如果你不得不用四臺機器才能裝下這樣一個模型，對客戶去適用這個環(huán)境就是一個很大的門檻，而如果你一臺機器，回去開機把模型裝上，馬上就能用上Chatbox、CherryStudio，就會極大方便大家去嘗試滿血版671B的模型。”劉軍說。

無獨有偶，天翼云、聯(lián)想百應(yīng)等也都在最近推出了基于DeepSeek等技術(shù)的一體機。一場關(guān)于推理算力的競爭已經(jīng)開始。

“真正到了推理場景，大家關(guān)心的是我的用戶體驗好不好，在保證用戶體驗的情況下，每元錢能有多少Token。”劉軍告訴數(shù)智前線，體驗和性價比將決定算力廠商在推理市場中的生存能力。

在他看來，推理目前要重點解決兩方面的問題，一個是怎么用更少的機器把模型裝進去、跑起來，另一個則是產(chǎn)生Token的速度是不是夠快。

“我們很多工作都在圍繞這兩個方面來開展。”劉軍舉例說，比如他們會通過PD分離的策略，將推理的兩個重要階段——預(yù)填充（Prefill）和解碼（Decode）解耦部署，通過構(gòu)建分離式算力資源池，縮短計算時間，降低計算成本，提高資源利用率。

不管是推理端，還是訓練端，智算市場作為大模型落地的重要支撐，在未來幾年內(nèi)將保持高速增長。在應(yīng)用爆發(fā)的臨界點到來之前，保有熱情，但不盲目激進，仍是最適合當下的一個行為準則。