人在WAIC,和大模型一起“狂奔”
文|魏琳華
編|王一粟
“人已經(jīng)多到炸館,逛展堪比廟會(huì)。”
2025年,WAIC的火爆程度已經(jīng)不用多說:閑魚上炒到2000元一張的門票;現(xiàn)場隨處可見的老外;各個(gè)展區(qū)被人流擠得水泄不通......
光是外圍的火爆就已經(jīng)說明——今年,AI大模型在應(yīng)用上已經(jīng)勢如破竹。
前所未有的參展產(chǎn)品數(shù)量,是AI應(yīng)用遍地開花的佐證:創(chuàng)紀(jì)錄的800家企業(yè)參展,帶來3000余產(chǎn)品及100+首發(fā)新品參展,涵蓋40+大模型、50+AI終端產(chǎn)品、60+智能機(jī)器人,和去年相比,產(chǎn)品數(shù)量整整翻了一番,不少觀眾散會(huì)紛紛戲稱“逛到斷腿”。
在一個(gè)展區(qū)中,你能看到各個(gè)品類下不同廠商演繹的多種玩法:機(jī)器人1:1復(fù)刻人類動(dòng)作、給人類調(diào)酒、搬東西;Agent寫代碼、作文、當(dāng)理財(cái)助手;AI+教育不僅有AI學(xué)習(xí)機(jī)、還搬上了AI黑板......
比起看得見摸不著的Agent“數(shù)字員工”,能看到實(shí)體的智能機(jī)器人成為了會(huì)場的“頂流”。
H3展館中,大片機(jī)器人“整活”的場景相當(dāng)壯觀:和真人對(duì)打的宇樹機(jī)器人、練習(xí)摞百事可樂的智元機(jī)器人、魔法原子的機(jī)器狗繞著場館跑來跑去......
除了面向C端用戶的產(chǎn)品爆發(fā),在B端,AI也已經(jīng)在企業(yè)中應(yīng)用起來。
“就在我們公司內(nèi)部,員工每天需要寫很多代碼,做很多研究型實(shí)驗(yàn),這里邊大概有 70% 的代碼是 AI 來寫,90% 數(shù)據(jù)分析是靠 AI 來做。”在MiniMax CEO閆俊杰的分享中,Agent構(gòu)建的智能系統(tǒng)已經(jīng)真正幫上了員工的忙。
隨著年初大模型進(jìn)入深度推理階段,性能進(jìn)入高可用的程度,加上訓(xùn)練和推理成本進(jìn)一步降低。經(jīng)過三年的一路狂奔,廠商們終于高調(diào)地秀起了肌肉。
推理模型的“爆發(fā)年”
從模仿學(xué)習(xí)到強(qiáng)化學(xué)習(xí),大模型已經(jīng)進(jìn)化到2.0時(shí)代。
以O(shè)penAI的o1模型為分水嶺,2025年成了推理模型的“爆發(fā)年”。區(qū)別于以往靠大量監(jiān)督數(shù)據(jù)提升性能,通過RL(強(qiáng)化學(xué)習(xí))算法的訓(xùn)練模式,讓大模型的能力邁上新一個(gè)階段。
由此,文字、視覺、多模態(tài)等領(lǐng)域,疊加推理能力成了國內(nèi)大模型公司上半年角逐的重點(diǎn)。
在WAIC大會(huì)上,“大模型新五強(qiáng)”之一階躍星辰就在會(huì)上發(fā)布了自家原生多模態(tài)推理模型Step-3,在開源梯隊(duì)中達(dá)到SOTA;商湯同樣在論壇中發(fā)布日日新V6.5多模態(tài)基座大模型,強(qiáng)調(diào)強(qiáng)推理、高效率和智能體三大優(yōu)化。
大方向轉(zhuǎn)向強(qiáng)化學(xué)習(xí)的基礎(chǔ)上,一個(gè)明顯的趨勢是,訓(xùn)練和推理的成本在上半年進(jìn)一步降低。通過使用新模型架構(gòu)的優(yōu)化、訓(xùn)練算法的進(jìn)步以及軟硬件協(xié)同的算力效率提升,大模型們開始比肩DeepSeek,給出更便宜的訓(xùn)練和推理成本。
閆俊杰給出了一個(gè)更為樂觀的判斷,認(rèn)為在接下來一兩年之內(nèi),最好模型的推理成本可能還能再降低一個(gè)數(shù)量級(jí)。
再從應(yīng)用方向來看,出于商業(yè)化落地考慮,絕大部分模型不會(huì)再去做上萬的參數(shù),同時(shí)向著商業(yè)化路線的應(yīng)用要求考慮。
以視頻生成來說,生數(shù)科技CEO駱怡航認(rèn)為,目前整個(gè)視頻生成還有進(jìn)一步優(yōu)化空間,他總結(jié)為“好快省”。
“首先一致性還需要提升,然后在生成的速度上還需要加快,第三是,在視頻生成的成本上還要大幅降低。”駱怡航說。
對(duì)應(yīng)到落地產(chǎn)品上,幾家視頻模型產(chǎn)品不約而同地貼合專業(yè)賽道的制作方向做優(yōu)化。生數(shù)科技旗下的產(chǎn)品Vidu 7月發(fā)布的Vidu Q1 參考生視頻功能,改變傳統(tǒng)視頻制作流程和AI圖生視頻流程,僅需上傳人物、道具、場景等參考圖,即可直接生成一段視頻,完全省去了分鏡制作的環(huán)節(jié),并且參考生支持7個(gè)主體一致不變形;快手可靈AI則在會(huì)議期間發(fā)布“靈動(dòng)畫布”,把AI輔助和多人協(xié)作放到了一塊無限大的工作界面中。
另外,AI公司們也開始圍繞著兩個(gè)業(yè)內(nèi)更加關(guān)注的產(chǎn)品落地——Agent和具身智能,為其打造專屬能力匹配的模型。
從智能體的發(fā)展來看,今年上半年涌現(xiàn)出一些為Agent“量身定做”的模型,比如更匹配上下文理解的超長文本模型、優(yōu)化Agent“視力”的視覺推理模型。再有,隨著具身智能的火爆,為機(jī)器人打磨“視覺”和“大腦”的任務(wù)也落在了大模型公司們的身上。在商湯、科大訊飛、階躍星辰等公司的展臺(tái),也有機(jī)器人在站臺(tái)表演。
最火熱的落地:Agent、具身智能
當(dāng)大模型能力突破到一定階段,應(yīng)用也隨之爆發(fā)。
階躍星辰創(chuàng)始人、CEO姜大昕表示:“從Step 1到Step 2兩代基模的快速迭代,促使我們深入思考什么才是最適合應(yīng)用的模型。隨著大模型進(jìn)入到強(qiáng)化學(xué)習(xí)發(fā)展階段,新一代推理模型成為主流,模型性能的提升固然顯著,但這是否完全等同于模型價(jià)值?面對(duì)這一產(chǎn)業(yè)之問,我們必須回歸客戶需求,立足真實(shí)應(yīng)用場景,探索模型創(chuàng)新落地的可行路徑。”
在WAIC現(xiàn)場,Agent和具身智能成了會(huì)場中最熱門的兩個(gè)賽道。多模態(tài)能力和推理能力的提升,讓Agent和具身智能裝上了“眼睛”和“大腦”。
Agent,幾乎出現(xiàn)在各個(gè)展臺(tái)中:
面向C端用戶,有少量通用Agent和多種面向細(xì)分場景的垂類Agent。比如百度的GenFlow 2.0支持多個(gè)智能體協(xié)作,階躍星辰的Agent則裝到了智能手機(jī)端上,搭載AI拍照問、AI助手等功能;剛上新全棧功能的MiniMax Agent,能讓用戶在幾分鐘做個(gè)網(wǎng)頁出來。
在智能硬件端,Agent也開始接管起人的生活體驗(yàn)。美的高端定位AI科技家電品牌COLMO落地應(yīng)用了行業(yè)首個(gè)適配家電家居全場景的AI Agent智能體——COLMO AI管家,通過“多維感知-自主學(xué)習(xí)-推理規(guī)劃-決策執(zhí)行”,提升智能家居對(duì)場景的理解能力。
做To B生意的軟硬件廠商,智能體成為企業(yè)幫助客戶增量提效的落地手段。除了在軟件端應(yīng)用,軟硬件協(xié)同的廠商也在AI平臺(tái)中植入智能體服務(wù)。在DeepSeek一體機(jī)展臺(tái),光錐智能就見到了政務(wù)/醫(yī)療等領(lǐng)域的Agent,作為其軟件服務(wù)端的新產(chǎn)品能力。
在上半年的進(jìn)展中,一個(gè)明顯的趨勢是,AI Agent從打輔助的定位,已經(jīng)開始過渡到自主驅(qū)動(dòng)任務(wù)完成的階段。
以亞馬遜云科技發(fā)布的編程智能體Kiro為例,它的Spider模式,在Agent執(zhí)行任務(wù)的需求-計(jì)劃-執(zhí)行過程中,AI已經(jīng)能在每個(gè)環(huán)節(jié)中提供助力。Kiro技術(shù)專家舉了個(gè)例子,比如,當(dāng)用戶給出一句話需求后,AI會(huì)根據(jù)需求創(chuàng)建更為詳細(xì)的PrD(產(chǎn)品需求文檔),把各種隱性的需求挖掘出來,確保AI能夠精準(zhǔn)執(zhí)行任務(wù),做出可交付的產(chǎn)品。
在企業(yè)內(nèi)部,多智能體的運(yùn)轉(zhuǎn)協(xié)作已經(jīng)初見成效。
談及大模型在工廠內(nèi)部的落地,美的集團(tuán)副總裁兼CDO張小懿告訴光錐智能,目前已經(jīng)看到了工廠用大模型的能力在進(jìn)行工廠的運(yùn)營改進(jìn),在3-4個(gè)月的嘗試中,目前靠智能體已經(jīng)能幫助產(chǎn)品實(shí)現(xiàn)品質(zhì)和效率上的提升。
“在美的洗衣機(jī)荊州工廠,我們已經(jīng)上線了14個(gè)智能體,這14個(gè)智能體能夠互相關(guān)聯(lián)起來運(yùn)行,”張小懿說。過往,這些數(shù)據(jù)全都需要人和人直接溝通協(xié)作,尋找問題根源。但交給智能體后,它自己就會(huì)找當(dāng)時(shí)的參數(shù)情況、設(shè)備、產(chǎn)線和具體型號(hào),再判斷出大致的結(jié)果。
“把控品質(zhì)的智能體,它能夠把相關(guān)數(shù)據(jù)全部回流到其中,實(shí)時(shí)判斷情況,當(dāng)發(fā)現(xiàn)品質(zhì)波動(dòng),它反過來會(huì)影響到負(fù)責(zé)產(chǎn)品設(shè)備維護(hù)的智能體和設(shè)備工藝智能體。”張小懿說。
縱觀下來,Agent市場在半年的搭建過后,在和企業(yè)磨合試驗(yàn)的過程中,暴露出一些技術(shù)上亟待完善的工作。
有Agent平臺(tái)工作人員告訴光錐智能,目前開發(fā)者們更關(guān)注長時(shí)記憶和MCP的生態(tài)擴(kuò)充,前者決定了讓Agent能夠在需要長久記憶的場景保留上下文信息,而針對(duì)一些即時(shí)場景,則需要及時(shí)將信息清理,避免無謂的成本浪費(fèi);MCP的擴(kuò)充讓Agent有更多工具可供調(diào)用。
同樣靠大模型武裝“大小腦”的具身智能,成為了這次展會(huì)品類數(shù)量最多的一個(gè)。
以具身智能的頭部來說,其主要包含大腦、小腦兩個(gè)部分。以主流的“大小腦”分層架構(gòu)來說,其中多模態(tài)大模型作為“大腦”,負(fù)責(zé)感知、理解和規(guī)劃;再由多個(gè)小模型結(jié)合運(yùn)動(dòng)控制算法組成“小腦”,負(fù)責(zé)運(yùn)動(dòng)控制和動(dòng)作生成。
不過,對(duì)于產(chǎn)品百花齊放、融資熱切的具身智能賽道來說,一切還處在開始階段,距離實(shí)際場景來說,還離落地太遠(yuǎn)。
其中發(fā)生在機(jī)器人賽道的一個(gè)問題是,今年,軟硬件拉開的差距更大了。
和云深處合作布局安防機(jī)器人賽道,康迪機(jī)器人技術(shù)總監(jiān)崔廣章對(duì)光錐智能表示,目前,硬件與軟件之間的代差還在加大。軟件已經(jīng)進(jìn)入了驗(yàn)證到量產(chǎn)的過程,但硬件還沒有達(dá)到,在功能、穩(wěn)定性和成本表現(xiàn)上還差了一些。
目前,面向工業(yè)的機(jī)器人的軟硬件水平,已經(jīng)可以滿足在特定工業(yè)場景下的一些任務(wù)。康迪科技和云深處合作的機(jī)器狗將銷向北美,用于北美倉庫的安防巡檢場景。
猶如去年徘徊的大模型落地,這兩條賽道還需要更多的摸索和模型能力的進(jìn)化支撐。
加速落地
“AI大模型的發(fā)展,從人工智能第四次浪潮的元年2022年開始,各路英豪都在一路狂奔。”科大訊飛副總裁李翔說。
在大模型技術(shù)上線不斷被拓寬的過程中,AI+大模型也在重構(gòu)產(chǎn)業(yè)智能的生態(tài)。在B端,通過AI挖掘數(shù)據(jù)和產(chǎn)業(yè)互聯(lián)網(wǎng)的價(jià)值,大模型和智能體逐漸承擔(dān)起更多提升收入、降低成本的任務(wù)。
“市面上的開源大模型很多,但它們都是獨(dú)立的個(gè)體”,做AI+工業(yè)互聯(lián)網(wǎng)的卡奧斯化工行業(yè)總經(jīng)理康健告訴光錐智能,“無論是垂類小模型還是行業(yè)模型,散點(diǎn)的價(jià)值還是有限的。”
以化工大模型為例,卡奧斯沒有選擇上來就做模型,而是搭了一個(gè)工業(yè)互聯(lián)網(wǎng)平臺(tái),把三個(gè)城市的所有集團(tuán)和二級(jí)單位的業(yè)務(wù)和數(shù)據(jù)拉通,再進(jìn)行數(shù)據(jù)收集和治理。在這個(gè)基礎(chǔ)上,大模型和智能體,就有了業(yè)務(wù)的需求拉動(dòng)及數(shù)據(jù)的支撐。
康健舉了個(gè)例子,以延長石油為例,生產(chǎn)經(jīng)營智能體及市場產(chǎn)品價(jià)格預(yù)測智能體的協(xié)同應(yīng)用,會(huì)根據(jù)產(chǎn)業(yè)鏈上的實(shí)時(shí)情況調(diào)整生產(chǎn)策略。根據(jù)成品油及化工品的價(jià)格及收益情況,調(diào)整生產(chǎn)計(jì)劃及各自產(chǎn)能,讓集團(tuán)產(chǎn)業(yè)鏈價(jià)值最大化。
“沒有業(yè)務(wù)及數(shù)據(jù)的互連,它拉通不了全產(chǎn)業(yè)鏈和全價(jià)值鏈,就不能把用戶本身和供應(yīng)商連起來,如果不連起來,智能體的價(jià)值就無法最大化。”康健說,“用單場景模型,你一年可能省10萬,如果基于我們的全產(chǎn)業(yè)鏈大模型進(jìn)行智能優(yōu)化,可能全年的價(jià)值是一個(gè)億”。
比起去年清一水但稍顯蒼白的行業(yè)客服、對(duì)話助手,通過深度結(jié)合行業(yè)數(shù)據(jù),AI今年在各行各業(yè)跑出了一些更具行業(yè)針對(duì)性的新功能,展現(xiàn)出更為成熟和實(shí)用的應(yīng)用前景。
在AI+醫(yī)療行業(yè)中,大模型公司通過和醫(yī)院合作,在數(shù)據(jù)訓(xùn)練的基礎(chǔ)上,一些有應(yīng)用價(jià)值的功能開始陸續(xù)落地。阿里在展示臺(tái)放了一個(gè)AI CT掃描的功能,基于其通用多模態(tài)醫(yī)療大模型,模型能夠根據(jù)病人的醫(yī)學(xué)影像自動(dòng)生成詳細(xì)的診斷報(bào)告,輔助醫(yī)生做判斷。
模型的能力決定應(yīng)用的上限,今年同理。其中一個(gè)明顯的節(jié)點(diǎn)就是推理模型DeepSeek-R1為代表的各個(gè)推理模型發(fā)布,進(jìn)一步提升了AI在行業(yè)中的應(yīng)用能力。
以教育行業(yè)為例,以DeepSeek為代表的推理大模型能力突破,在AI教育方面找到了對(duì)應(yīng)的應(yīng)用場景。
“通常來講,家長對(duì)于AI教育有很多顧慮,比如擔(dān)心直接抄答案、誤導(dǎo)學(xué)生,但是今年最大的一個(gè)利好就是DeepSeek的出現(xiàn)。”學(xué)而思學(xué)習(xí)機(jī)AI產(chǎn)品負(fù)責(zé)人李通說。“只有當(dāng)家長自己試過大模型,并且認(rèn)可了能力,他才會(huì)愿意讓自己的孩子也試一試。”
李通提及,編程和解題是基座大模型過去一段時(shí)間提升較為明顯的能力。對(duì)于純文本數(shù)學(xué)題,大模型能在完全沒見過的情況下,做到92%的準(zhǔn)確率。在解題率提升的基礎(chǔ)上,今年AI在大模型一對(duì)一講題這個(gè)場景,在過去的這段時(shí)間里面出現(xiàn)明顯的突破。
從“炫技”到“實(shí)干”,AI大模型正破冰行業(yè)深水區(qū)。隨著AI能力的進(jìn)一步突破,冰山之下蘊(yùn)藏的價(jià)值,才會(huì)慢慢展現(xiàn)全貌。
原文標(biāo)題 : 人在WAIC,和大模型一起“狂奔”

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長度6~500個(gè)字
最新活動(dòng)更多
-
即日-9.16點(diǎn)擊進(jìn)入 >> 【限時(shí)福利】TE 2025國際物聯(lián)網(wǎng)展·深圳站
-
10月23日火熱報(bào)名中>> 2025是德科技創(chuàng)新技術(shù)峰會(huì)
-
10月23日立即報(bào)名>> Works With 開發(fā)者大會(huì)深圳站
-
10月24日立即參評(píng)>> 【評(píng)選】維科杯·OFweek 2025(第十屆)物聯(lián)網(wǎng)行業(yè)年度評(píng)選
-
11月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
12月18日立即報(bào)名>> 【線下會(huì)議】OFweek 2025(第十屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
推薦專題
- 1 先進(jìn)算力新選擇 | 2025華為算力場景發(fā)布會(huì)暨北京xPN伙伴大會(huì)成功舉辦
- 2 人形機(jī)器人,正狂奔在批量交付的曠野
- 3 宇樹機(jī)器人撞人事件的深度剖析:六維力傳感器如何成為人機(jī)安全的關(guān)鍵屏障
- 4 解碼特斯拉新AI芯片戰(zhàn)略 :從Dojo到AI5和AI6推理引擎
- 5 AI版“四萬億刺激”計(jì)劃來了
- 6 2025年8月人工智能投融資觀察
- 7 8 a16z最新AI百強(qiáng)榜:硅谷頂級(jí)VC帶你讀懂全球生成式AI賽道最新趨勢
- 9 Manus跑路,大廠掉線,只能靠DeepSeek了
- 10 地平線的野心:1000萬套HSD上車