訂閱
糾錯(cuò)
加入自媒體

產(chǎn)業(yè)丨2025中國(guó)產(chǎn)業(yè)AI以小模型破局,欲叩響真落地之門

前言2025年2月,深圳福田區(qū)政務(wù)大廳的辦事窗口前,市民發(fā)現(xiàn)原本需要3天審核的公文,如今幾小時(shí)就能反饋。這背后,是70名[AI數(shù)智員工]在240個(gè)政務(wù)場(chǎng)景中高效運(yùn)轉(zhuǎn)。文書起草、政策解讀、招商輔助,而支撐它們的核心,是DeepSeek研發(fā)的671B參數(shù)模型DeepSeek-R1。有意思的是,DeepSeek-R1嚴(yán)格來(lái)說(shuō)不算小模型,但它采用的專家混合技術(shù)卻顛覆了行業(yè)認(rèn)知。根據(jù)任務(wù)自動(dòng)激活部分網(wǎng)絡(luò),只運(yùn)行需要的模塊,用更少算力解決了復(fù)雜問(wèn)題。這讓業(yè)界第一次認(rèn)真思考:大語(yǔ)言模型的[大],真的是所有場(chǎng)景的必需品嗎?從這一疑問(wèn)開(kāi)始,2025年的中國(guó)產(chǎn)業(yè)AI賽道,悄然掀起了一場(chǎng)[小模型革命]。

作者 | 方文三 圖片來(lái)源 |  網(wǎng) 絡(luò) 

大模型的[落地困境]與小模型的[剛剛好] 

2023年是大模型的[狂飆元年],GPT-4、文心一言等模型憑借[寫代碼、寫論文、做推理]的全能表現(xiàn),讓業(yè)界驚嘆[通用AI來(lái)了]。

但到了2024年,當(dāng)企業(yè)真正想把大模型裝進(jìn)業(yè)務(wù)流程時(shí),卻撞進(jìn)了三重[落地墻]。

某互聯(lián)網(wǎng)大廠做過(guò)一項(xiàng)測(cè)試:用GPT-4驅(qū)動(dòng)客服Agent,一天10萬(wàn)次調(diào)用的API費(fèi)用接近40萬(wàn)元,一個(gè)月就是上千萬(wàn)。

這對(duì)中小商家來(lái)說(shuō),相當(dāng)于[用直升機(jī)送快遞]。

反觀小模型,阿里發(fā)布的Qwen2.5-Coder-7B在代碼生成場(chǎng)景中,推理成本比上一代大模型下降70%。

7B左右的小模型驅(qū)動(dòng)客服,成本直接砍去90%,月均支出可控制在10萬(wàn)元以內(nèi)。

更關(guān)鍵的是隱性成本,2024年全球LLM托管的云基礎(chǔ)設(shè)施投資激增至570億美元,是同期LLM API服務(wù)市場(chǎng)規(guī)模的10倍。

服務(wù)器、GPU集群、配套工具鏈的投入,一旦轉(zhuǎn)向小模型,前期投入就可能變成沉沒(méi)成本。

但即便如此,仍有越來(lái)越多企業(yè)選擇[換軌],因?yàn)樾∧P偷拈L(zhǎng)期運(yùn)維成本,實(shí)在太香了。

在金融交易場(chǎng)景中,2秒的延遲可能錯(cuò)過(guò)最佳交易時(shí)機(jī);在客服對(duì)話中,2秒的等待會(huì)讓用戶滿意度下降30%。

而大模型一次推理往往需要2-3秒,甚至更久;小模型卻能輕松實(shí)現(xiàn)毫秒級(jí)響應(yīng)。

醫(yī)療記錄、財(cái)務(wù)數(shù)據(jù)、用戶身份信息等企業(yè)核心數(shù)據(jù),一旦上傳云端大模型,就面臨外泄風(fēng)險(xiǎn)。

而小模型的本地化部署能力,恰好擊中了這一痛點(diǎn)。

英偉達(dá)與佐治亞理工學(xué)院聯(lián)合發(fā)布的論文《Small Language Models are the Future of Agentic AI》,更是用數(shù)據(jù)佐證了小模型的價(jià)值。

在MetaGPT、Open Operator等開(kāi)源Agent項(xiàng)目中,40%-70%的調(diào)用任務(wù),其實(shí)只需要小模型就能完成。

大模型像[超級(jí)大腦],適合解決開(kāi)放性復(fù)雜問(wèn)題;而Agent更多是[執(zhí)行型角色],需要的是小模型這種[記得住流程、干活穩(wěn)]的[小腦]。

這就是小模型崛起的底層邏輯:不是因?yàn)樗却竽P蚚更先進(jìn)],而是因?yàn)锳I落地的主要形態(tài)(Agent),恰好需要[剛剛好的智能]。

三大典型場(chǎng)景,看見(jiàn)[小而專]的力量

小模型的落地,從來(lái)不是[一刀切]的。它的核心優(yōu)勢(shì),在于對(duì)[流程清晰、重復(fù)性強(qiáng)、隱私敏感]場(chǎng)景的精準(zhǔn)適配。

從客服到金融,從邊緣設(shè)備到醫(yī)療,小模型正在用[小身材]撬動(dòng)[大價(jià)值]。

①標(biāo)準(zhǔn)化流程任務(wù):客服、文檔處理的[效率加速器]。這類場(chǎng)景的關(guān)鍵,是不需要?jiǎng)?chuàng)造力,只需要穩(wěn)定性。

客服Agent只需回答[賬單在哪、怎么退貨](méi),文檔Agent只需[提取重點(diǎn)、整理結(jié)構(gòu)],小模型經(jīng)過(guò)針對(duì)性微調(diào)后,完全能達(dá)到比大模型更靠譜的效果。

Gartner調(diào)研顯示,45%部署小模型的企業(yè),在文檔處理、客服等場(chǎng)景中實(shí)現(xiàn)了[成本下降+準(zhǔn)確率提升]的雙重收益。

②高合規(guī)領(lǐng)域:金融、醫(yī)療的[精準(zhǔn)解讀者]。McKinsey報(bào)告指出,小模型在法律、金融、醫(yī)療等行業(yè)更受青睞,不是因?yàn)樗埽且驗(yàn)樗煽亍?/p>

在法律領(lǐng)域,小模型可基于判例庫(kù)做條款匹配,輸出的法律建議解釋性更強(qiáng),避免大模型模糊泛化導(dǎo)致的風(fēng)險(xiǎn);

在醫(yī)療領(lǐng)域,2.5B參數(shù)的小模型可輔助病理切片分析,在本地設(shè)備上快速標(biāo)注疑似病灶,既不泄露患者數(shù)據(jù),又能為醫(yī)生節(jié)省30%的閱片時(shí)間。

③邊緣與端側(cè):從工廠設(shè)備到手機(jī),小模型[無(wú)處不在]。

在智能制造場(chǎng)景中,英偉達(dá)部署在工廠端的小模型,推理延遲低、帶寬消耗少,可實(shí)時(shí)分析設(shè)備傳感器數(shù)據(jù),預(yù)測(cè)故障風(fēng)險(xiǎn);

在手機(jī)端,三星Galaxy S24搭載的SlimLM系列,能離線完成文檔摘要、問(wèn)答,運(yùn)行流暢還不耗電;

在汽車智能座艙中,面壁智能的MiniCPM-V 4.0(4B參數(shù))可實(shí)現(xiàn)[語(yǔ)音指令+圖像識(shí)別]雙模態(tài)交互,斷網(wǎng)時(shí)也能識(shí)別障礙物、調(diào)取導(dǎo)航數(shù)據(jù)。

讓人驚喜的是邊緣設(shè)備的突破,石化行業(yè)的設(shè)備檢修系統(tǒng),用2.5B模型實(shí)現(xiàn)[語(yǔ)音識(shí)別+常規(guī)故障排查],工程師在現(xiàn)場(chǎng)用手機(jī)就能調(diào)用;

農(nóng)業(yè)領(lǐng)域的[AI病蟲害識(shí)別設(shè)備],搭載1.7B小模型,在田間地頭就能分析葉片圖像,無(wú)需聯(lián)網(wǎng)上傳數(shù)據(jù),小模型讓AI從[云端黑盒],變成了[嵌在機(jī)器里的芯片]。

國(guó)內(nèi)產(chǎn)業(yè)AI的[大+小]協(xié)同,不是替代而是補(bǔ)位 

[小模型會(huì)取代大模型嗎?]這是行業(yè)最常問(wèn)的問(wèn)題。答案很明確:不會(huì)。

2025年的中國(guó)產(chǎn)業(yè)AI,正在走向[大模型+小模型]的混合架構(gòu),大模型做戰(zhàn)略規(guī)劃,小模型做戰(zhàn)術(shù)執(zhí)行,兩者協(xié)同才能最大化價(jià)值。

這種模式正在普及,中大型企業(yè)用7B-9B小模型做私有化部署,集成到CRM、ERP等核心系統(tǒng);遇到戰(zhàn)略報(bào)告撰寫、跨業(yè)務(wù)推理等復(fù)雜任務(wù),再[求助]大模型;

1B-3B小模型則部署在移動(dòng)端、邊緣設(shè)備,處理文檔總結(jié)、現(xiàn)場(chǎng)問(wèn)詢等輕量任務(wù)。

比如石化行業(yè)的設(shè)備檢修系統(tǒng),用2.5B模型實(shí)現(xiàn)[語(yǔ)音識(shí)別+常規(guī)故障排查],復(fù)雜故障再上傳大模型分析。

據(jù)不完全統(tǒng)計(jì),過(guò)去三年,國(guó)內(nèi)廠商[≤10B參數(shù)]小模型的發(fā)布占比,從2023年的23%飆升至2025年的56%,成為大模型版圖中增長(zhǎng)最快的賽道。

阿里、騰訊、百度、DeepSeek等廠商,不僅推出小模型,還把[推理框架、量化壓縮、微調(diào)流程]打包成[解決方案],降低企業(yè)部署門檻。

阿里Qwen-Agent提供文檔問(wèn)答、財(cái)報(bào)解析的模塊化插件,企業(yè)按需即插即用;

騰訊混元Lite+私有部署SaaS中臺(tái),中型B端企業(yè)無(wú)需MLOps團(tuán)隊(duì)就能部署;

百度ERNIELite政務(wù)套件,針對(duì)本地合規(guī)需求優(yōu)化權(quán)限與日志審計(jì)功能;

DeepSeek開(kāi)源醫(yī)療問(wèn)答小模型,在私立醫(yī)院試點(diǎn)中,診斷建議準(zhǔn)確率達(dá)88%。

海外廠商也在跟進(jìn),微軟Phi-3提供完整推理工具,英偉達(dá)TensorRT-LLM+NIM服務(wù)實(shí)現(xiàn)[模型壓縮-微調(diào)-部署]一條龍,Hugging Face把小模型變成任務(wù)組件。

但中國(guó)廠商的優(yōu)勢(shì)在于本土化適配,比如對(duì)中文語(yǔ)境的理解、對(duì)政務(wù)/金融等行業(yè)合規(guī)要求的熟悉,這是海外廠商短期內(nèi)難以超越的。

2025年,國(guó)內(nèi)開(kāi)源社區(qū)涌現(xiàn)出一批垂直領(lǐng)域小模型。

MiniCPM在教育領(lǐng)域內(nèi)測(cè),集成至作業(yè)點(diǎn)評(píng)系統(tǒng);中文RAG框架Langboat和LaWGPT專注政法場(chǎng)景;

DeepSeek開(kāi)源的代碼小模型,成為中小企業(yè)的編程助手。

這些開(kāi)源模型,讓企業(yè)無(wú)需從零構(gòu)建,只需做場(chǎng)景化微調(diào)就能落地。

更重要的是技術(shù)平權(quán),過(guò)去只有巨頭能玩得起大模型;現(xiàn)在,5人團(tuán)隊(duì)用開(kāi)源小模型,就能開(kāi)發(fā)出行業(yè)專用Agent。

小模型是中國(guó)AI的破局點(diǎn)和超車機(jī)會(huì)

美國(guó)在高端芯片上的限制,讓中國(guó)大模型發(fā)展面臨算力瓶頸;而小模型對(duì)算力的低需求,恰好繞開(kāi)了這一痛點(diǎn)。

零一萬(wàn)物在低端芯片上實(shí)現(xiàn)小模型高效訓(xùn)練,百川AI與高通合作開(kāi)發(fā)手機(jī)端小模型,百度、字節(jié)跳動(dòng)在智能終端預(yù)裝小模型,這些實(shí)踐都證明:沒(méi)有頂級(jí)GPU,中國(guó)企業(yè)照樣能做出好用的小模型。

清華大學(xué)五道口金融學(xué)院的報(bào)告指出,中國(guó)發(fā)展小模型具有優(yōu)勢(shì):

①在特定場(chǎng)景中,小模型的優(yōu)化能力可超越國(guó)外通用模型。

②小模型的成本效率更高,適合中小企業(yè)普及。

③中國(guó)有豐富的落地場(chǎng)景和用戶數(shù)據(jù),能快速迭代小模型。

這些優(yōu)勢(shì),讓中國(guó)在全球AI競(jìng)賽中,找到了一條不依賴高端芯片的差異化路徑。

以醫(yī)療領(lǐng)域?yàn)槔,?guó)外大模型雖能回答通用醫(yī)療問(wèn)題,但對(duì)中國(guó)的醫(yī)保政策、常見(jiàn)病診療規(guī)范理解不足。

而國(guó)內(nèi)醫(yī)療小模型基于本地病歷、行業(yè)標(biāo)準(zhǔn)訓(xùn)練,能給出更貼合實(shí)際的建議。

當(dāng)國(guó)外大模型還在爭(zhēng)奪[云端霸權(quán)]時(shí),中國(guó)企業(yè)已在端側(cè)小模型上[搶跑]。

面壁智能的MiniCPM-V 4.0可在手機(jī)上穩(wěn)定運(yùn)行,支持圖文交互;

騰訊混元0.5B-7B模型適配筆記本、智能座艙;華為云與車企合作,把小模型裝進(jìn)智能座艙,實(shí)現(xiàn)[離線語(yǔ)音控制]。

端側(cè)是AI落地的[最后一公里],也是未來(lái)最大的增量市場(chǎng)。

中國(guó)有全球最大的智能手機(jī)、智能家居、智能汽車市場(chǎng),這些設(shè)備都需要輕量級(jí)AI。

小模型的普及,不僅能讓AI[飛入尋常百姓家],還能為中國(guó)產(chǎn)業(yè)AI構(gòu)建端側(cè)生態(tài)壁壘,這是國(guó)外大模型難以復(fù)制的優(yōu)勢(shì)。

結(jié)尾:

2025年的產(chǎn)業(yè)AI,已經(jīng)告別了[比參數(shù)、比算力]的粗放階段,進(jìn)入[比落地、比價(jià)值]的精耕時(shí)代。

小模型的崛起,不是對(duì)大模型的否定,而是對(duì)AI產(chǎn)業(yè)化的[補(bǔ)位]。

它讓AI從高高在上的技術(shù),變成觸手可及的工具;從巨頭的游戲,變成中小企業(yè)的機(jī)遇。

當(dāng)AI能嵌進(jìn)工廠的傳感器、醫(yī)院的診斷設(shè)備、家里的路由器、汽車的智能座艙,當(dāng)每一個(gè)機(jī)器都有[剛剛好的智能],我們才能說(shuō):AI真正叩響了產(chǎn)業(yè)落地的大門。

部分資料參考:自然系列:《2025AI指數(shù)報(bào)告:沒(méi)有一家獨(dú)大,[小而美]模型大有可為》,產(chǎn)業(yè)家:《2025中國(guó)產(chǎn)業(yè)AI以小模型破局,欲叩響真落地之門》,清華五道口:《LLM時(shí)代小模型的應(yīng)用潛力與挑戰(zhàn)》,AI智研工坊:《小型語(yǔ)言模型(SLM)的崛起:未來(lái)趨勢(shì)、生態(tài)系統(tǒng)與應(yīng)用實(shí)踐深度解析》,小黑魔法:《輕量化AI革命!三大中文小模型巔峰對(duì)決:誰(shuí)將重新定義NLP未來(lái)?》,AI人工智能D1net:《小模型:傳統(tǒng)行業(yè)智能化轉(zhuǎn)型的[輕量級(jí)引擎]》,安邦智庫(kù):《成本考量下的[小AI]才是方向》,工業(yè)AI專家:《AI小模型:人工智能的[輕騎兵]》,AI科技評(píng)論:《AI的下一個(gè)戰(zhàn)場(chǎng):端側(cè)模型崛起》,CPSE安博會(huì):《小模型和大模型,誰(shuí)離市場(chǎng)更近?》,頭部科技:《[SLM優(yōu)先]才是智能體的未來(lái)?英偉達(dá)力推小模型,比Qwen3-8B快6倍》

       原文標(biāo)題 : AI芯天下丨產(chǎn)業(yè)丨2025中國(guó)產(chǎn)業(yè)AI以小模型破局,欲叩響真落地之門

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)