2024年中國大模型發(fā)展指數(shù)報告(總第3期)
(點擊文末閱讀原文,可查看PDF報告)
摘 要
本報告基于“研究、實踐、支撐”三維評估框架,系統(tǒng)解析中國大模型領域動態(tài)。數(shù)據(jù)顯示,2023年8月至2024年12月,中國大模型綜合指數(shù)年復合增長率7.69%,呈現(xiàn)“爆發(fā)增長-震蕩調整-韌性修復”的演進格局,政策推動、技術迭代與資本周期成為關鍵主導因素。
政策層面央地聯(lián)動:國家網(wǎng)信辦《生成式人工智能服務應急響應指南》推動安全合規(guī),工信部《5G揚帆升級方案》等文件加速AI與工業(yè)互聯(lián)網(wǎng)融合;地方政策聚焦算力(天津、山東)、場景(上海金融大模型語料庫)、生態(tài)(廣東大模型開源社區(qū)),初步形成“技術研發(fā)-合規(guī)治理-產業(yè)協(xié)同”的政策矩陣。
行業(yè)實踐表現(xiàn)分化:備案大模型因政策窗口期呈脈沖式增長(2024年Q4備案數(shù)量環(huán)比增90%),而初創(chuàng)企業(yè)受資本流動影響劇烈波動(2024年4月融資額環(huán)比暴漲73倍)。技術突破方面,混合專家架構(MoE)、低精度訓練(FP8)等技術顯著降低國產大模型訓練成本(如DeepSeek訓練成本僅為GPT-4的8.8%),中文多模態(tài)、全流程Agent(如Manus)等差異化能力凸顯競爭優(yōu)勢。
挑戰(zhàn)與機遇并存:算力基礎設施波動與社會創(chuàng)新情緒周期性震蕩倒逼構建穩(wěn)定性支撐體系。展望未來,技術國產化、輕量化與場景專業(yè)化將主導下一階段發(fā)展,而政策需進一步平衡創(chuàng)新激勵與風險管理,強化數(shù)據(jù)要素流通與綠色算力協(xié)同能力。
01
大模型相關政策
(一)我國大模型行業(yè)相關政策
為促進大模型技術的發(fā)展,我國陸續(xù)發(fā)布了多項行業(yè)政策(如表1-1所示)。
例如,2024年11月,工信部等十二部門發(fā)布《5G規(guī)模化應用“揚帆”行動升級方案》,提出支持互聯(lián)網(wǎng)企業(yè)、基礎電信企業(yè)和終端企業(yè)聯(lián)合建設5G新型應用創(chuàng)新工場和體驗中心,開展AI大模型、面向公眾應用的網(wǎng)絡切片等新技術試點,促進網(wǎng)絡、內容、終端協(xié)同創(chuàng)新,為5G新業(yè)務新產品研發(fā)提供試驗環(huán)境。
2024年12月,國家網(wǎng)信辦發(fā)布《網(wǎng)絡安全標準實踐指南——生成式人工智能服務安全應急響應指南(征求意見稿)》,提出圍繞生成式人工智能服務安全事件給出了安全事件的分類和分級建議,并給出了生成式人工智能服務安全事件應急響應過程,包括應急準備、監(jiān)測預警、應急處置、總結改進階段的管理措施和技術方法,可用于指導生成式人工智能服務提供者提高安全應急響應能力。
表1-1 我國大模型行業(yè)部分相關政策(2023年8月-2024年12月)
資料來源:公開渠道,零壹智庫
(二)部分省份大模型行業(yè)相關政策
為了響應國家號召,各省份積極推動大模型行業(yè)的發(fā)展。比如,2024年7月天津市發(fā)布《天津市算力產業(yè)發(fā)展實施方案(2024-2026年)》,提出加快算法模型發(fā)展。發(fā)展計算機視覺、語音語義識別、言語交互等領域算法模型,積極布局通用和垂直行業(yè)大模型,支持高校、企業(yè)和科研機構加強基礎理論和共性技術研究。部分省份大模型主要相關政策如表1-2所示。
表1-2部分省份大模型行業(yè)部分相關政策
(2023年8月-2024年12月)
資料來源:公開渠道,零壹智庫
02
評價體系
(一)指標體系
本報告延續(xù)前期大模型指數(shù)的指標框架,仍然從大模型研究、大模型實踐和大模型支撐3個一級指標、8個二級指標構建指數(shù)。在末級指標上,對兩項指標做了適當優(yōu)化和調整,具體包括:
人才支撐指標優(yōu)化:原“相關高校數(shù)量”與“相關專業(yè)數(shù)量”指標因存在顯著同步性,即高校數(shù)量增長與專業(yè)增設趨勢高度一致,合并為單一“相關專業(yè)數(shù)量”指標以提升評價效率。
企業(yè)實踐指標完善:保持“初創(chuàng)企業(yè)”和“備案企業(yè)”雙維度評價,其中備案企業(yè)評估新增“備案大模型公眾關注度”觀測指標,形成更立體的評估視角。
表2-1 中國大模型發(fā)展指數(shù)指標體系
(二)指標權重
指標權重的確定有客觀賦權和主觀賦權兩類方法。客觀賦權法可排除主觀干擾,應用相對廣泛。熵權法、標準離差法和CRITIC法是主要的客觀賦權法,三種方法均用變量的變異確定權重。其中,CRITIC法考慮了變量之間的沖突,確定的權重更為精準(Chen et al.,2021;Chen et al.,2022;許滌龍和陳雙蓮,2015)。本報告首先對各指標數(shù)據(jù)進行離差標準化處理,以避免量綱的差異對測算結果的影響。
本報告選擇CRITIC法確定各指標的權重。第i個指標的權重:
根據(jù)上述計算公式,計算各一級指標權重。
(三)數(shù)據(jù)來源
本指數(shù)所涉數(shù)據(jù)來源于國家統(tǒng)計局、網(wǎng)信辦、教育部、中國知網(wǎng)、中國日報網(wǎng)、智慧芽、企業(yè)預警通、零壹智庫等。
03
大模型指數(shù)總體情況
(一)大模型總指數(shù)年復合增長率7.69%
2023年8月至2024年12月,大模型指數(shù)呈現(xiàn)“波動式上升”特征。從100增長至326.96,累計增長226.96%,月復合增長率約7.69%。2023年8月至2024年4月快速上升,指數(shù)從100飆升至217.56,其中2024年4月增速高達35.18%。2024年5月、8月出現(xiàn)明顯回調,增速分別為-13.53%、-1.28%。
圖3-1 大模型指數(shù)與增速
數(shù)據(jù)來源:零壹智庫
1. 2024年4月增速突增原因
一是政策催化。2024年4月,中國工業(yè)和信息化部發(fā)布《人工智能賦能新型工業(yè)化實施方案》,明確提出加速大模型在制造業(yè)的落地應用,并通過專項資金支持企業(yè)技術升級。政策紅利直接刺激市場預期,推動相關企業(yè)指數(shù)快速上漲。例如,華為盤古大模型因工業(yè)場景適配獲得多地政府訂單,當月訂單金額超10億元。北京、上海等地同期啟動“AI+工業(yè)”試點項目,大模型供應商訂單量激增。二是技術突破與產品發(fā)布。
二是技術突破與產品發(fā)布。多家頭部企業(yè)發(fā)布新一代大模型產品,參數(shù)規(guī)模與性能顯著提升。例如:百度發(fā)布“文心大模型4.0”,支持多模態(tài)交互,調用量單月增長120%;騰訊推出金融行業(yè)專用大模型“星脈”,與國有銀行簽訂戰(zhàn)略合作。
三是算力基礎設施擴容。2024年Q1全國新增智能算力規(guī)模達200EFLOPS,同比增長45%,4月起多地智算中心投入運營,降低企業(yè)訓練成本。例如,阿里云宣布大模型訓練費用下調30%,吸引中小企業(yè)加速模型部署。
2. 2024年11月增速突增的原因
一是年底項目沖刺與資本集中投放。11月為傳統(tǒng)“年終預算執(zhí)行期”,政府與企業(yè)為完成年度目標加速項目落地國有銀行、保險機構在年底前集中采購風控、客服類大模型服務;地方政府AI專項債資金在Q4密集撥付,推動智慧城市、醫(yī)療等領域需求爆發(fā)。如2024年11月AI招標項目數(shù)量環(huán)比增長68%,金額超200億元。
二是電商與消費場景驅動。雙十一期間,大模型在營銷、物流、客服等環(huán)節(jié)的應用需求激增,如京東“言犀”大模型處理客服咨詢量達日均10億次,同比提升3倍;阿里“通義千問”賦能商家生成個性化廣告素材,覆蓋超50萬店鋪。
三是國際競爭與國產替代加速。2024年10月美國升級AI芯片出口限制,倒逼國內企業(yè)加快大模型自主研發(fā),華為昇騰芯片產能11月環(huán)比提升40%,支撐國產大模型訓練;百度、科大訊飛等企業(yè)宣布完成“去英偉達化”技術遷移。
(二)中國大模型研究指數(shù)月復合增長率達9%
中國大模型研究指數(shù)是由學術研究和技術研究兩個二級指標所構成,從計算得出大模型研究指數(shù)從2023年8月92.45增長到2024年12月355.95,增長了263.50點,月復合9%。大模型研究指數(shù)增長率從15.24%下降到3.83%。
我國大模型研究指數(shù)逐月上升的原因,主要是因為學術成果和技術研發(fā)水平不斷提高所導致。
圖3-2 大模型研究指數(shù)及增長率
數(shù)據(jù)來源:零壹智庫
1.大模型學術研究指數(shù)增長率先下降再上升再下降
大模型研究指數(shù)的增長是政策、技術、市場、產學研協(xié)同及國際競爭共同作用的結果,大模型研究中的學術研究和技術研究都在全面發(fā)展,這就導致研究成果豐碩。
從原始數(shù)據(jù)來看,學術研究論文數(shù)量從2023年8月412篇增加到了2024年12月的4106篇,增加了3694篇,技術研究(專利授權數(shù)量)數(shù)量從23615件增加到53008件,增加了29693件。
從指數(shù)計算結果我們可以看出大模型研究二級指數(shù)學術研究指數(shù)從2023年8月35.72增長到2024年12月的355.95,學術研究指數(shù)增長率從2023年08月21.84%增長到2024年7月30.73%后再下降到2024年12月3.61%;技術研究指數(shù)從2023年8月157.68增長到2024年12月的355.95,技術研究指數(shù)增長率從13.52%下降到2024年7月-1.03%后再增長到2024年12月4.09%。
大模型學術研究指數(shù)增長率先下降再上升再下降的原因,主要是前期的部分研究方向因效果未達預期而被暫時擱置等導致;中期隨著數(shù)據(jù)中心、智能計算中心、數(shù)字技術不斷突破等使研究成果顯著;后期隨著中國大模型相關政策的實施,引發(fā)公眾信任危機,導致部分研究轉向安全性與可解釋性優(yōu)化,使研究成果在短期內受到一定影響。
2.大模型技術研究指數(shù)增長率先下降再上升
大模型技術研究指數(shù)增長率從2023年8月13.52%下降到2024年10月0.27%再上升到2024年12月4.09%,呈現(xiàn)出先下降再上升。
先下降的具體原因算力與資源不足、市場競爭日益激烈、技術難題等導致;上升的具體原因是新技術(知識蒸餾)的出現(xiàn)顯著降低訓練成本使得中小企業(yè)和學術機構能夠參與研究,同時提升了應用場景的多樣性吸引了更多資本投入等原因導致。
圖3-3 大模型學術研究指數(shù)和大模型技術研究指數(shù)及增長率
數(shù)據(jù)來源:零壹智庫
(三)大模型實踐指數(shù)月度復合增長率達12.21%
大模型實踐指數(shù)從2023年8月的52.54攀升至2024年12月的331.85,實現(xiàn)12.21%的月度復合增長率。期間經歷兩次顯著震蕩:2023年10月和2024年5月分別遭遇52.29%、52.71%的斷崖式下跌;2024年4月與11月則呈現(xiàn)105.74%、180.27%的爆發(fā)式增長。
圖3-4 大模型實踐指數(shù)及增長率
數(shù)據(jù)來源:零壹智庫
1.政策周期主導備案大模型的脈沖式增長
備案大模型指數(shù)與政策監(jiān)管節(jié)奏高度同步,2023年8月《生成式AI服務管理暫行辦法》實施后,在合規(guī)窗口期觸發(fā)備案大模型的短期爆發(fā)。
備案大模型數(shù)量從8個激增至14個,增幅75%,同步推動備案公司注冊資本增長30.0%,由295萬元增長至384萬元,直接推動當月備案大模型指數(shù)暴漲395.67%。2024年11-12月,備案大模型數(shù)量從214個躍升至407個,增幅為90.2%。備案公司注冊資本從2513萬元增至13.6億元,增長441%。
一方面,地方政府在年末產業(yè)規(guī)劃周期中強化前沿技術布局,通過資質審批與財政補貼等引導企業(yè)集中備案,從而促進備案大模型的增長。另一方面,中國石油天然氣集團有限公司等大公司入局,導致大模型備案企業(yè)注冊資本量激增。
圖 3-5 備案大模型指數(shù)及增長率
數(shù)據(jù)來源:零壹智庫
2.資本流動引起初創(chuàng)企業(yè)指數(shù)波動
2024年4月,初創(chuàng)企業(yè)資本金從3月的42.6萬元飆升至3152萬元,增長73.4倍,但次月驟降98.3%,降低至52萬元,同期初創(chuàng)企業(yè)指數(shù)呈現(xiàn)先增長169.84%然后下降60.89%的極端波動,這也導致了大模型實踐指數(shù)在該時期的劇烈波動。
圖3-6 大模型初創(chuàng)企業(yè)指數(shù)及增長率
數(shù)據(jù)來源:零壹智庫
2024年11月,初創(chuàng)企業(yè)資本金環(huán)比增長999%,由29.5萬元增長至3232萬元,資本窗口期效應在該月表現(xiàn)尤為顯著。根據(jù)公開數(shù)據(jù),2024年10月,全球AIGC行業(yè)融資總額達到724億元,較9月上升234%(注1)。2024年下半年,海外AIGC產業(yè)鏈企業(yè)獲得融資次數(shù)顯著高于前兩個季度,共有608家海外企業(yè)在年內披露了融資。
同時,國內AIGC賽道在2024年整體呈現(xiàn)出逐漸活躍的趨勢,前三個季度的融資次數(shù)分別為68、103和171,十一月一批企業(yè)密集完成融資。下半年大模型的密集融資推動初創(chuàng)企業(yè)指數(shù)單月增長211.90%,凸顯資本對技術里大模型的敏感性。
(四)大模型支撐指數(shù)復合增長率達8.2%
1.大模型支撐指數(shù)的總體變化特征
大模型支撐指數(shù)從2023年8月的177.81增長至2024年12月的288.49,全年呈現(xiàn)“波動上升”趨勢,年均復合增長率8.2%,但中間經歷多次劇烈震蕩。最明顯的兩次下跌發(fā)生在2023年12月(-15.03%)和2024年2月(-8.70%),而最大漲幅出現(xiàn)在2024年5月2024年12月分別增長16.16%和10.96%。
3-7 大模型支撐指數(shù)及增長率
數(shù)據(jù)來源:零壹智庫
這種波動主要源于算力基礎設施和大模型創(chuàng)新熱情指數(shù)的不穩(wěn)定。具體來看,算力基礎指數(shù)劇烈波動,單月暴漲1069%或暴跌93%,社會創(chuàng)新熱情大起大落,導致指數(shù)整體“進兩步退一步”的特征。而政策支撐呈現(xiàn)穩(wěn)步增長,人才支撐在一定時期內相對穩(wěn)定。由于人才支撐由于高校招生一年一次,導致數(shù)據(jù)在月度研究中相對穩(wěn)定,在此不做分析。
2.算力基礎和社會創(chuàng)新熱情波動加劇大模型支撐指數(shù)震蕩
算力基礎設施方面,超算中心和智能計算中心數(shù)量整體較少,波動較為平穩(wěn),且均在2024年12月上升至巔峰,均為10個。數(shù)據(jù)中心數(shù)量的劇烈波動造成了算力基礎設施指數(shù)的震蕩。其中,2024年5月算力指數(shù)暴漲1069%,從17.06升至199.55,推動支撐指數(shù)單月增長16.16%。這源于數(shù)據(jù)中心數(shù)量的距離波動,從15個暴增至134個。
圖3-8 大模型支撐指數(shù)下屬指數(shù)及增長率
數(shù)據(jù)來源:零壹智庫
此外,社會創(chuàng)新熱情指數(shù)大起大落,加劇整體波動性。大模型創(chuàng)新熱情指數(shù)與社交媒體討論量、融資事件等強相關。其中,2024年3月,大模型創(chuàng)新熱情指數(shù)增長率高達116.69%,可能與該月 Claude 3 Haiku、sora等大模型發(fā)布,以及馬斯克與openai的糾紛等事件有關。
3.政策支撐穩(wěn)步增長
大模型政策從2023年8月19.56升2024年12月至355.95。大模型治理文件詞頻從6020次增至15834次,翻了2.6倍,是促進大模型支撐指數(shù)增長的穩(wěn)定器。
大模型政總體呈現(xiàn)遞增趨勢,尤其是在研究期早期呈現(xiàn)顯著的增長,2024年之后,隨著政策進步一步完善,大模型政策增長有所放緩。除了數(shù)量增長外,大模型政策內容也逐步升級,早期政策側重“合規(guī)準入”,后續(xù)政策轉向“算力調度”“綠色低碳”等精細化管理。
圖3-9 大模型政策指數(shù)及其增長率
數(shù)據(jù)來源:零壹智庫
04
專題一:Deepseek打破
AGI“參數(shù)規(guī)模決定性能”鐵律
DeepSeek是由深度求索(DeepSeek)公司推出的先進大模型系列,自2023年首次亮相以來迅速崛起,通過持續(xù)迭代實現(xiàn)多項技術突破。
2024年,DeepSeek開源了通用大模型DeepSeek LLM和代碼專用模型DeepSeek Coder,憑借128K長上下文窗口和強大的數(shù)學推理能力引發(fā)行業(yè)關注。2025年2月,DeepSeek發(fā)布里程碑式的DeepSeek-V3版本,不僅在MMLU、GPQA等權威評測中超越GPT-4 Turbo,更以超萬億token的高質量訓練數(shù)據(jù)和創(chuàng)新的MoE架構樹立新標桿。更重要的是,DeepSeek以超低訓練成本達到了全球一流水平,改寫了大模型的研發(fā)范式。
DeepSeek的開源策略顯著降低了AI技術應用門檻,推動產學研協(xié)同創(chuàng)新,同時企業(yè)級API服務為金融、教育、醫(yī)療等行業(yè)提供了智能化解決方案。該系列通過持續(xù)優(yōu)化模型效率與成本平衡,正在重塑AI商業(yè)化落地范式,成為全球AGN競爭中的重要參與者。
(一)Deepseek優(yōu)勢
1.多模態(tài)支持與中文優(yōu)化
DeepSeek支持文本、圖像、語音等多模態(tài)數(shù)據(jù)處理,并通過中文語料庫的深度優(yōu)化,顯著提升了中文場景下的語義理解和生成質量。其“深度思考”功能結合預訓練知識庫和邏輯推理能力,可對復雜問題進行多維度分析。
2.混合專家架構(MoE)與輕量化部署
采用MoE架構(如DeepSeek-V3含6710億參數(shù),每次僅激活370億參數(shù)),動態(tài)路由算法減少計算冗余,配合FP8混合精度訓練,顯著降低顯存占用和訓練成本(如V3模型訓練成本僅557.6萬美元)。支持本地化部署,可在消費級硬件(如RTX 4090)運行。
3.強化學習驅動的推理能力
通過純強化學習(如GRPO算法)實現(xiàn)推理能力自主進化,無需依賴監(jiān)督微調(SFT),在數(shù)學解題、代碼生成等復雜任務中表現(xiàn)優(yōu)異。
4.開源生態(tài)與低成本API
開源1.5B至70B參數(shù)模型及工具鏈(支持FP8量化、動態(tài)負載監(jiān)控),并提供每百萬tokens僅0.48美元的API服務,成本僅為OpenAI的2%-5%。
表4-1 deepseek與國外競品比較
資料來源:公開渠道,零壹智庫
(二)DeepSeek的行業(yè)影響
1.軟件開發(fā)效率的革新
DeepSeek通過開源模型權重和代碼補全工具,顯著降低了開發(fā)門檻,使中小企業(yè)和個人開發(fā)者能夠快速構建定制化應用。其代碼補全工具在過去12周內用戶量增長72%,直接沖擊傳統(tǒng)網(wǎng)頁開發(fā)、應用開發(fā)領域,自由開發(fā)者需轉向更高階的創(chuàng)意或架構設計以保持競爭力。
開源生態(tài)吸引了全球開發(fā)者參與優(yōu)化,例如華為云、阿里云等平臺集成DeepSeek模型后,開發(fā)者可一鍵調用API,加速產品迭代。此外,模型蒸餾技術允許企業(yè)從大模型中提取輕量化版本,進一步適配資源有限的小團隊需求。
2.教育行業(yè)的智能化轉型
生成式AI工具(如問答助手)導致傳統(tǒng)教育平臺流量下滑,用戶轉向AI驅動的個性化學習方案。例如,北森控股推出AI招聘助手、智能面試官等工具,結合DeepSeek模型提升招聘效率;Boss直聘通過自研模型優(yōu)化簡歷匹配和面試輔導,縮短招聘周期至數(shù)分鐘。教育模式從標準化內容分發(fā)轉向自適應學習,AI可根據(jù)學生能力動態(tài)調整教學路徑,降低教師重復性工作負擔。
3.制造業(yè)的流程優(yōu)化與成本控制
DeepSeek大模型助力制造業(yè)實現(xiàn)生產流程智能化,例如景業(yè)智能通過部署AI優(yōu)化機器人控制與信息化管理,提升生產線效率;華為云與徐工集團合作開發(fā)工業(yè)大模型,實時分析設備數(shù)據(jù)以減少停機時間。物流領域,順豐利用AI優(yōu)化配送路徑,降低運營成本20%以上。此類應用推動制造業(yè)從“經驗驅動”轉向“數(shù)據(jù)驅動”,減少對人工經驗的依賴。
4.創(chuàng)意產業(yè)的效率與內容革新
DeepSeek的圖像生成工具簡化了設計流程,沖擊傳統(tǒng)設計平臺(如Figma),但也為Canva等工具提供了功能擴展機會。AI在文案生成、視頻剪輯等領域的應用,替代了部分基礎創(chuàng)意工作,例如營銷文案生成效率提升50%,但需人類審核以規(guī)避“幻覺”風險。AI同時為創(chuàng)作者提供數(shù)據(jù)驅動的靈感支持,例如通過分析用戶偏好生成定制化內容。
5.芯片行業(yè)的國產化與生態(tài)重構
DeepSeek的優(yōu)化技術(如FP8混合精度訓練)降低了推理階段的算力需求,推動市場從訓練芯片向推理芯片轉移,威脅英偉達的壟斷地位。國產芯片廠商(如華為昇騰)加速適配低精度運算需求,出貨量增長超30%。開源模型還促進軟硬件協(xié)同創(chuàng)新,例如景業(yè)智能的本地化部署案例推動邊緣計算芯片需求,形成國產算力生態(tài)閉環(huán)。
05
專題二:Manus重構
人類與機器在復雜系統(tǒng)的共生范式
2025年3月5日,中國AI創(chuàng)業(yè)公司蝴蝶效應(Butterfly Effect)正式發(fā)布了全球首款通用AI智能體產品——Manus,標志著智能體技術邁入全新階段。Manus基于革命性的"神經符號協(xié)同架構",首次實現(xiàn)了大語言模型的推理能力與專業(yè)智能體執(zhí)行系統(tǒng)的完美融合。Manus的核心優(yōu)勢在于其自主規(guī)劃任務并實時調整的能力,能夠在沒有預先規(guī)劃的情況下完成復雜任務。
Manus開放平臺已吸引超過300家制造業(yè)、醫(yī)療和服務業(yè)企業(yè)接入,正在重塑從工業(yè)自動化到家庭服務的全場景智能生態(tài)。
(一)Manus優(yōu)勢
1.全流程自主任務執(zhí)行能力
Manus是一款通用型AI Agent,能夠獨立完成從任務規(guī)劃到執(zhí)行的全流程操作,例如撰寫報告、股票分析、旅行規(guī)劃等。其核心在于將用戶指令轉化為具體行動,直接交付成果(如可視化圖表、代碼文件、分析報告等),而非僅提供建議。例如,在簡歷篩選中,Manus可自動解壓文件、逐頁分析、生成候選人排名。
2.多智能體協(xié)同架構
采用多代理系統(tǒng)(MAS),各子代理運行于獨立虛擬機中,分別負責規(guī)劃、執(zhí)行、驗證等環(huán)節(jié),模擬人類“Plan-Do-Check-Act”工作流。這種架構提升了任務分解與并行處理能力,同時確保不同任務間的隔離與安全性。
3.強大的工具調用與集成能力
Manus可靈活調用代碼編輯器、瀏覽器、文檔處理器等工具,支持自動化代碼編寫、網(wǎng)頁爬取、文件操作等復雜操作。例如,在房產分析中,它能通過Python計算預算、抓取房源數(shù)據(jù)并生成多維度報告。
4.自主學習與記憶優(yōu)化
內置長短期記憶模塊,可記錄用戶偏好(如輸出格式偏好)并優(yōu)化后續(xù)任務執(zhí)行策略。例如,用戶若偏好圖表呈現(xiàn),Manus會在同類任務中自動調整結果展示方式。
5.技術性能領先
在GAIA基準測試中,Manus的Level 1-3任務處理能力均達到SOTA(State-of-the-Art),性能超越OpenAI的DeepResearch等同類模型。
表5-1 Manus與國外競品比較
資料來源:公開渠道,零壹智庫
(二)Manus的行業(yè)影響
1.技術范式革新
Manus的"神經符號協(xié)同架構"突破了傳統(tǒng)AI智能體的局限性,將大語言模型的泛化能力與專業(yè)領域執(zhí)行系統(tǒng)相結合,實現(xiàn)了從"單任務自動化"到"多場景自主決策"的跨越。其動態(tài)技能擴展機制為智能體賦予了持續(xù)進化的可能,推動行業(yè)從靜態(tài)規(guī)則驅動轉向自適應學習驅動的技術范式。
2.產業(yè)應用變革
在制造業(yè)領域,Manus智能體已實現(xiàn)從產線質檢到供應鏈調度的全流程自主優(yōu)化,某汽車工廠部署后生產效率提升40%;在服務業(yè),其多模態(tài)交互能力使客服、導購等場景的響應準確率達到人類專家水平。這種跨行業(yè)的滲透正在重新定義"自動化"的邊界,催生"智能體即服務"(Agent-as-a-Service)的新商業(yè)模式。
3.生態(tài)重構與標準競爭
Manus開放平臺吸引了全球開發(fā)者共建技能庫,其模塊化設計降低了智能體開發(fā)門檻,形成類似"App Store"的生態(tài)體系。這一策略加速了行業(yè)從封閉系統(tǒng)向開放協(xié)作轉型,同時使中國首次在智能體技術標準制定中掌握話語權,動搖了西方企業(yè)在AI基礎設施層的主導地位。
4.人機關系重塑
Manus構建了全新的"智能伙伴"交互范式。傳統(tǒng)AI系統(tǒng)作為被動工具需要精確指令,而Manus通過多模態(tài)感知和意圖理解技術,實現(xiàn)了對人類模糊需求的"心智化"解讀——當用戶說"幫我處理這個麻煩事"時,它能結合上下文自動識別"麻煩事"具體指代的工作瓶頸還是家庭矛盾,并給出針對性解決方案。
5.改變全球AI競爭格局
Manus的快速商業(yè)化驗證了通用智能體的可行性,迫使谷歌、Meta等巨頭加速相關布局。其在中國市場的先發(fā)優(yōu)勢,助力本土產業(yè)鏈在智能制造、智慧城市等領域形成差異化競爭力,可能改變全球AI產業(yè)的價值分配格局。
06
總結與展望
(一)總結
1.政策驅動下的多維度布局
政策重心從“合規(guī)準入”(如《生成式AI服務管理暫行辦法》)轉向“生態(tài)構建”和“場景深耕”(如廣東聚焦開源社區(qū)、上海建立金融大模型語料庫)。地方政策強化差異化競爭,寧夏利用算力補貼吸引數(shù)據(jù)中心,山西推動礦山安全大模型研發(fā),形成“國家統(tǒng)籌+地方專精”的協(xié)同路徑。
2.技術突破與成本重構
混合專家架構(MoE)、動態(tài)路由技術(如DeepSeek-V3)使大模型參數(shù)激活效率提升5-10倍,訓練成本降低80%以上(從GPT-4的6300萬美元降至500萬美元級)。國產自主化進程加速,華為昇騰芯片產能提升40%,F(xiàn)P8低精度訓練等技術推動推理成本降至國際競品的1/20。
3.實踐落地的兩極分化
備案模型爆發(fā),2024年Q4新增備案模型193個(環(huán)比+90%),主要集中于金融風控、政務客服等高合規(guī)需求場景。初創(chuàng)企業(yè)高波動,2024年4月單月融資額環(huán)比增73倍,但次月驟降98.3%,反映資本對大模型研發(fā)周期與商業(yè)化落地效率的審慎評估,短期投機性注資與長期價值錨定尚未形成有效平衡。
4.支撐體系的脆弱性暴露
算力基礎設施增長依賴脈沖式投入(如2024年5月數(shù)據(jù)中心數(shù)量單月增780%),社會創(chuàng)新熱情易受國際技術事件(如Sora發(fā)布)擾動。折射出數(shù)字基建與創(chuàng)新生態(tài)的結構性失衡,算力供給的脈沖式躍進難以支撐可持續(xù)創(chuàng)新韌性,國際技術事件的應激性擾動突顯自主創(chuàng)新鏈成熟度不足。
(二)展望
1.技術革新驅動“三化”趨勢
一是AI Agent輕量化。MoE架構+低比特量化(如4-bit權重)推動百億參數(shù)模型在手機、IoT設備端運行,催生“個人AI代理”時代。
二是能力升級自主化。強化學習(如GRPO算法)與神經架構搜索(NAS)結合,實現(xiàn)模型推理能力的動態(tài)優(yōu)化,適用于實時決策場景(如自動駕駛、高頻交易)。
三是多模態(tài)融合深度化。視頻生成大模型(對標Sora)、3D建模大模型(如3D-GPT)將突破文本-圖像的單向交互,構建沉浸式工業(yè)設計、元宇宙社交新范式。
2.新范式重構產業(yè)邏輯
一是AI Agent生態(tài)崛起。以Manus為代表的全流程Agent將滲透企業(yè)核心業(yè)務流。例如,金融領域實現(xiàn)“自動財報分析→風險預警→投資決策”閉環(huán),工業(yè)場景支持“需求感知→智能排產→故障自修復”。開源Agent框架(如AutoGPT)降低開發(fā)門檻,預計2025年全球Agent經濟規(guī)模將突破千億美元。
二是存算一體架構革命;趹涀杵、光子芯片的存算一體技術,將解決傳統(tǒng)馮·諾依曼架構的“內存墻”問題,支持EB級模型的實時推理(能效比提升100倍)。
3、政策與產業(yè)協(xié)同的關鍵方向
一是綠色算力網(wǎng)絡建設。結合液冷技術(PUE<1.1)與西部可再生能源,構建“東數(shù)西算—低碳智算”一體化基礎設施,支撐萬億參數(shù)模型的可持續(xù)發(fā)展。
二是數(shù)據(jù)要素市場化突破。通過聯(lián)邦學習+區(qū)塊鏈技術建立跨行業(yè)數(shù)據(jù)沙盒,推動醫(yī)療、交通等領域的大模型訓練合規(guī)化。
三是安全治理體系升級。動態(tài)風險監(jiān)測(如AIGC深度偽造溯源)、對抗攻擊防御技術將成為大模型服務的標配能力。
四是AI原生硬件突破。專為大模型優(yōu)化的三進制芯片、光子計算卡、神經形態(tài)芯片量產,支撐ZettaFLOP級算力需求。中國將有機會在全球AI硬件競賽中開辟“第二戰(zhàn)場”,推動大模型研發(fā)從“依賴制程工藝”轉向“架構定義規(guī)則”的新階段。
注:1、2024年11月全球AIGC投融資報告-End-
(點擊文末閱讀原文,可查看PDF報告)
原文標題 : 2024年中國大模型發(fā)展指數(shù)報告(總第3期)

請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 AI 眼鏡讓百萬 APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語權
- 3 深度報告|中國AI產業(yè)正在崛起成全球力量,市場潛力和關鍵挑戰(zhàn)有哪些?
- 4 上海跑出80億超級獨角獸:獲上市公司戰(zhàn)投,干人形機器人
- 5 國家數(shù)據(jù)局局長劉烈宏調研格創(chuàng)東智
- 6 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 7 百億AI芯片訂單,瘋狂傾銷中東?
- 8 Robotaxi新消息密集釋放,量產元年誰在領跑?
- 9 格斗大賽出圈!人形機器人致命短板曝光:頭腦過于簡單
- 10 “搶灘”家用機器人領域,聯(lián)通、海爾、美的等紛紛入局