人形機(jī)器人真正走到我們身邊,大概還需要10年左右。
文|趙艷秋 游勇
編|周路平
北京亦莊的一場(chǎng)人形機(jī)器人半程馬拉松,在吸引著巨大關(guān)注的同時(shí),也讓網(wǎng)友吵翻了天。
有人說(shuō),這場(chǎng)馬拉松讓熱鬧了半年的人形機(jī)器人“祛魅”了,它看起來(lái)更像是個(gè)遙控的大號(hào)電動(dòng)玩具,在網(wǎng)絡(luò)上,人形機(jī)器人各種酷炫動(dòng)作,但在現(xiàn)實(shí)中連路都走不穩(wěn);也有人說(shuō),對(duì)新產(chǎn)業(yè)應(yīng)該給予更多的寬容,只有現(xiàn)在的起步,才有未來(lái)的發(fā)展,就像汽車(chē)在誕生之初跑得比馬車(chē)還慢,但并不妨礙汽車(chē)的進(jìn)步。
北京經(jīng)開(kāi)區(qū)管委會(huì)副主任梁靚介紹,此次“人機(jī)半馬”比賽,更像一次產(chǎn)業(yè)對(duì)話(huà)和機(jī)器人“大練兵”。相比于最后的成績(jī),業(yè)內(nèi)普遍認(rèn)為,這更像是一場(chǎng)人形機(jī)器人系統(tǒng)工程的極限演練。
雖然很多人對(duì)“首馬”中機(jī)器人的表現(xiàn)有些失望,但實(shí)際上人形機(jī)器人這兩年的發(fā)展在提速。以機(jī)器人本體為例,過(guò)去一兩年迭代的速度,可能超過(guò)了之前10年的迭代。
今年初,“具身智能”首次被寫(xiě)入《政府工作報(bào)告》,成了產(chǎn)業(yè)界的熱詞。具身智能產(chǎn)業(yè)鏈足夠長(zhǎng),市場(chǎng)體量足夠大,而人形機(jī)器人是其中技術(shù)集成度最高的。在行業(yè)被熱捧的背后,人形機(jī)器人還面臨諸多挑戰(zhàn)。業(yè)界正在探索將大模型與機(jī)器人結(jié)合,一些企業(yè)在思考推動(dòng)如何將人形機(jī)器人在產(chǎn)業(yè)中落地。“真正走到我們身邊,我認(rèn)為大概還需要10年左右。”北京通用人工智能研究院院長(zhǎng)朱松純說(shuō)。
01
當(dāng)科幻照進(jìn)現(xiàn)實(shí)
4月19日,北京亦莊,作為全球首個(gè)人形機(jī)器人參與的半程馬拉松賽事,熱度非常高,尤其是在AI和具身智能概念火熱的當(dāng)下,大家都在關(guān)注機(jī)器人在賽場(chǎng)上的表現(xiàn)。
在現(xiàn)場(chǎng),機(jī)器人賽道和人工賽道中間有護(hù)欄分隔,很多報(bào)名參加了半馬的人都在跟著機(jī)器人一起奔跑,甚至站在兩旁為機(jī)器人加油歡呼。而無(wú)論在家中、地鐵上,很多人也在通過(guò)直播觀看人形機(jī)器人在馬拉松賽的首秀。
當(dāng)天有20個(gè)機(jī)器人參賽,其中7個(gè)跑完了全程21公里,而第一個(gè)出發(fā)的天工機(jī)器人不負(fù)眾望拿下了冠軍,用時(shí)2小時(shí)40分鐘,配速達(dá)到了每小時(shí)八九公里,中途更換了3次電池。
不過(guò),相比于在網(wǎng)絡(luò)視頻上人形機(jī)器人的酷炫表現(xiàn),真實(shí)的比賽現(xiàn)場(chǎng)讓很多人感覺(jué)到了落差。
比如松延動(dòng)力的N2機(jī)器人“旋風(fēng)小子”在最后的沖刺階段,不小心摔了一跤,把“頭”都摔掉了,甚至有些在外形上擬人化很高的機(jī)器人,剛起步就摔在了起跑線(xiàn)上;一些機(jī)器人在中途遇到了故障,不得不從補(bǔ)給車(chē)?yán)锬贸鰝溆玫臋C(jī)器人繼續(xù)完成后續(xù)的比賽。
很多機(jī)器人都需要人工在旁邊輔助,甚至用手?jǐn)v扶著;一些機(jī)器人在賽道上不斷走出“S形”路線(xiàn),陪跑工程師不得不出手拉回來(lái);另外由于高強(qiáng)度運(yùn)動(dòng),導(dǎo)致關(guān)節(jié)發(fā)熱,也需要在關(guān)鍵部位經(jīng)常噴冷卻液給機(jī)械結(jié)構(gòu)降溫。
以至于很多人說(shuō),最累的不是機(jī)器人,而是在旁邊跟隨的工程師,他們不僅要跟著奔跑,還需要時(shí)刻關(guān)注機(jī)器人的動(dòng)向。
根據(jù)主辦方的介紹,這次參賽的隊(duì)伍有兩種參賽方式,一種是遙控模式,考察的主要是硬件層面的能力,比如關(guān)節(jié)、電機(jī)、能耗、散熱等;另一種是跟跑模式,需要機(jī)器人能夠準(zhǔn)確跟隨、快速響應(yīng)前方目標(biāo)。
而現(xiàn)場(chǎng)大部分機(jī)器人采用的是遙控模式,會(huì)有工程師在旁邊控制機(jī)器人的奔跑速度和方向。雖然主辦方賽前會(huì)為人形機(jī)器人賽隊(duì)提供線(xiàn)路的GPS坐標(biāo)數(shù)據(jù),但這些人形機(jī)器人并不能實(shí)現(xiàn)完全自主控制。
在網(wǎng)絡(luò)上關(guān)注度很高的宇樹(shù)機(jī)器人,當(dāng)天的表現(xiàn)也不出色,起步就摔倒。針對(duì)表現(xiàn)不佳的質(zhì)疑,宇樹(shù)科技還專(zhuān)門(mén)發(fā)了一則聲明,稱(chēng)有好幾個(gè)獨(dú)立團(tuán)隊(duì)在使用,“不同人操作或開(kāi)發(fā)情況下,機(jī)器人的表現(xiàn)差別很大,請(qǐng)大家不要誤解。”據(jù)悉,清華一個(gè)團(tuán)隊(duì)拿著宇樹(shù)機(jī)器人去參賽,相當(dāng)于是拿了宇樹(shù)的硬件去跑了自己訓(xùn)練的算法。這個(gè)團(tuán)隊(duì)當(dāng)天也沒(méi)能跑完全程。不過(guò)也有網(wǎng)友質(zhì)疑,為什么宇樹(shù)官方不來(lái)參賽?之前又跑又跳、行云流水的視頻,是真的假的?
鈦虎機(jī)器人產(chǎn)品生態(tài)負(fù)責(zé)人諶威則在騰訊科技的一場(chǎng)直播中坦言,這次比賽不只是為了“跑”,它本質(zhì)上是在測(cè)試人形機(jī)器人的“基礎(chǔ)身體能力”。馬拉松是一種非常適合做“壓力測(cè)試”的場(chǎng)景,比如這次亦莊半馬的比賽地形,包含了平地、坡道,全程線(xiàn)路共包括6個(gè)左轉(zhuǎn)道、8個(gè)右轉(zhuǎn)道,最小轉(zhuǎn)彎角90度。這些都考驗(yàn)了機(jī)器人精準(zhǔn)的路徑規(guī)劃和靈活的轉(zhuǎn)向能力。
通過(guò)這樣實(shí)戰(zhàn)的方式,能夠看到問(wèn)題和發(fā)現(xiàn)不足,比如關(guān)節(jié)精度、熱管理、電源系統(tǒng)、控制算法、通信干擾等問(wèn)題,在這場(chǎng)馬拉松賽中得以全面暴露,從而推動(dòng)整個(gè)行業(yè)快速迭代。而且在一段20多公里封閉路段的珍貴數(shù)據(jù),為企業(yè)提供了珍貴的數(shù)據(jù)。
諶威說(shuō),這次比賽最特別的一點(diǎn)是所有參賽企業(yè)都在統(tǒng)一標(biāo)準(zhǔn)下,誠(chéng)實(shí)面對(duì)自己的技術(shù)狀態(tài),不再像過(guò)去那樣通過(guò)剪輯展示“機(jī)器人陪我一天”的表演場(chǎng)景。對(duì)于公眾來(lái)說(shuō),這次是非常難得的真實(shí)展示,也是一種科學(xué)普及。
02
是祛魅還是加速?
在馬拉松之后,有人說(shuō)“對(duì)人形機(jī)器人祛魅了”。但從產(chǎn)業(yè)實(shí)際情況和發(fā)展速度來(lái)看,包括人形機(jī)器人在內(nèi)的具身智能,其發(fā)展是在加速。
“大模型出來(lái)之后,機(jī)器人行業(yè)最大的變化就是驅(qū)動(dòng)范式的變化,從傳統(tǒng)的模型驅(qū)動(dòng)方式,變?yōu)榱艘粋(gè)數(shù)據(jù)驅(qū)動(dòng)的方式。因?yàn)槿诵螜C(jī)器人要進(jìn)入到復(fù)雜未知場(chǎng)景中,現(xiàn)實(shí)中沒(méi)有這么多模型,那么它最終的理想情況,應(yīng)該是以數(shù)據(jù)作為指導(dǎo),或者說(shuō)是行為數(shù)字化,把我們?nèi)嗽诂F(xiàn)實(shí)工作中的技能采集數(shù)據(jù)化,然后轉(zhuǎn)移給機(jī)器人。”樂(lè)聚機(jī)器人董事長(zhǎng)冷小坤說(shuō)。
而因?yàn)榉妒降淖兓,也給具身智能提出非常大的挑戰(zhàn),其一是數(shù)據(jù)。“相比無(wú)人駕駛,具身智能更大的挑戰(zhàn)是先有雞還是先有蛋的問(wèn)題,即數(shù)據(jù)從哪來(lái)。”智源研究院院長(zhǎng)王仲遠(yuǎn)說(shuō)。全球電動(dòng)汽車(chē)因?yàn)橛谢镜倪\(yùn)行功能,它的輔助駕駛系統(tǒng)每天都可以收集數(shù)據(jù)進(jìn)行迭代。“而機(jī)器人如果不能完成具體的場(chǎng)景任務(wù),就沒(méi)辦法形成規(guī);N(xiāo)量,也就無(wú)法收集數(shù)據(jù)、迭代模型,整體陷入了‘死循環(huán)’。”
這也能看出這次馬拉松賽事,創(chuàng)造出20多公里封閉路段,對(duì)機(jī)器人運(yùn)動(dòng)性能研發(fā)的珍貴性。很多機(jī)器人公司結(jié)束比賽后,已迫不及待地去分析數(shù)據(jù)。
“數(shù)據(jù)的稀缺,導(dǎo)致無(wú)法實(shí)現(xiàn)具身智能的泛化能力。”軟通動(dòng)力副總裁兼技術(shù)研究院副院長(zhǎng)雒冬梅告訴數(shù)智前線(xiàn),“拿抓取這件事來(lái)說(shuō),在某一空間某一個(gè)節(jié)點(diǎn)上,機(jī)器人順利去實(shí)現(xiàn)抓取,但換一個(gè)空間維度,就做不到了。”
“整個(gè)產(chǎn)業(yè)目前采用了多種手段,例如虛擬采集、合成數(shù)據(jù)采集、多模態(tài)數(shù)據(jù)融合采集,來(lái)逐步解決數(shù)據(jù)問(wèn)題。”雒冬梅說(shuō)。
不過(guò),這些獲得數(shù)據(jù)的技術(shù)路徑,也都存在不同程度的挑戰(zhàn)。比如,合成數(shù)據(jù)、生成動(dòng)作序列的方法中,最大的挑戰(zhàn)是空間匹配度并不好。在虛擬空間形成的抓取數(shù)據(jù),放到機(jī)器人本體上,會(huì)出現(xiàn)抓取位置偏差、抓取姿態(tài)錯(cuò)誤,甚至根本無(wú)法成功抓取目標(biāo)物體,無(wú)法完成預(yù)期動(dòng)作。
為此,今年北京、杭州、無(wú)錫、南京、重慶等地,都在積極建設(shè)數(shù)采中心,未來(lái)幾年將會(huì)陸續(xù)投產(chǎn)。“它有點(diǎn)像我們之前算力中心的投資邏輯。”雒冬梅說(shuō)。數(shù)采中心是完全面向場(chǎng)景化的,投資很高,比如要采集抹墻機(jī)器人需要的數(shù)據(jù),就要搭建樓房場(chǎng)景,實(shí)際采集、驗(yàn)證后,將數(shù)據(jù)集提供給機(jī)器人企業(yè),降低業(yè)界的開(kāi)發(fā)成本,這也可以說(shuō)是數(shù)據(jù)要素發(fā)展的另一種形態(tài)。
在這些數(shù)采中心中,實(shí)地采集打乒乓球、疊衣服、掃地等一個(gè)個(gè)技能的數(shù)據(jù)。如在北京人形機(jī)器人創(chuàng)新中心,正全力建設(shè)百萬(wàn)量級(jí)的高密度、高質(zhì)量、高通用性數(shù)據(jù)集。這需要產(chǎn)業(yè)鏈各方聯(lián)手,如各機(jī)器人企業(yè)、百度智能云等模型和算力企業(yè)。
具身智能面臨的第二大挑戰(zhàn),是機(jī)器人本身對(duì)復(fù)雜任務(wù)的理解,以及在動(dòng)作序列中能否形成連貫性,這是下一階段業(yè)界要去重點(diǎn)攻克的難題。
“比如有十位客人,請(qǐng)機(jī)器人給其中一個(gè)人倒杯水,它可以理解,也可以執(zhí)行倒水動(dòng)作。”雒冬梅說(shuō),“但如果讓機(jī)器人引導(dǎo)客人到某個(gè)會(huì)議室,然后再給他倒杯水,兩三層任務(wù),機(jī)器人就沒(méi)法形成連貫性了。”
為什么今年受到關(guān)注的Manus,能實(shí)現(xiàn)一系列工作,而人形機(jī)器人就做不到?雒冬梅告訴數(shù)智前線(xiàn),Manus是數(shù)字AI,而具身智能是“物理AI”,兩者之間唯一的區(qū)別,就是空間維度。而空間維度不斷變化,這比訓(xùn)練輔助駕駛難度還要大,因?yàn)檩o助駕駛還有一系列交通規(guī)則可以遵循,而通常的物理空間,沒(méi)有明確的規(guī)則,動(dòng)態(tài)不確定。這還需要大模型的泛化性來(lái)解決。
北京通用人工智能研究院院長(zhǎng)朱松純說(shuō),現(xiàn)在最大的難點(diǎn)在于(數(shù)字)智能體和硬件本體的融合,在全球無(wú)論是產(chǎn)業(yè)界還是學(xué)術(shù)界,現(xiàn)在已開(kāi)始在探討這兩者的結(jié)合問(wèn)題。
03
今年有真實(shí)的落地場(chǎng)景嗎?
既然人形機(jī)器人有這些需要逐步解決的挑戰(zhàn),它什么時(shí)候能落地?
其實(shí),伴隨人工智能的火爆,今年以來(lái),行業(yè)市場(chǎng)中涌現(xiàn)出急迫需求。中工互聯(lián)董事長(zhǎng)智振告訴數(shù)智前線(xiàn),他們打算購(gòu)買(mǎi)機(jī)器人和機(jī)器狗,在工業(yè)場(chǎng)景下展開(kāi)探索。“工藝流程要與設(shè)備關(guān)聯(lián),軟硬件結(jié)合,才能形成閉環(huán)和競(jìng)爭(zhēng)力。”智振提出“具身智能體”概念,它既是智能體,有大模型優(yōu)化和決策能力,也具備執(zhí)行能力,比如控制閥門(mén),還能根據(jù)外部反饋?zhàn)晕疫M(jìn)化。
“以前我比較懷疑,人形機(jī)器人為什么要進(jìn)工業(yè)場(chǎng)景?”樂(lè)聚機(jī)器人冷小坤說(shuō),但接觸一些企業(yè)后發(fā)現(xiàn),其實(shí)大量場(chǎng)景,現(xiàn)在只能用人。因?yàn)楫a(chǎn)品的品類(lèi)太多了,可能每半天或一天就要更換一批產(chǎn)線(xiàn),而沒(méi)有一種自動(dòng)化設(shè)備把產(chǎn)線(xiàn)都覆蓋掉。在這種情況下,目前最優(yōu)解就是人形機(jī)器人。樂(lè)聚在通信和新能源車(chē)廠,都在做相同的研發(fā),讓人形機(jī)器人與場(chǎng)景結(jié)合。
冷小坤說(shuō),人形機(jī)器人什么時(shí)候能像博士一樣聰明,像家電一樣便宜,也就到了產(chǎn)業(yè)爆發(fā)的時(shí)刻。他預(yù)測(cè)5年內(nèi),人形機(jī)器人成本能達(dá)到一輛小轎車(chē)的水平。
雒冬梅則認(rèn)為,機(jī)器人特別適合優(yōu)先考慮高危場(chǎng)景下的應(yīng)用,而這還有很多難題要攻克。為此,軟通動(dòng)力已與理工華匯,成立軟通天匯特種人形機(jī)器人實(shí)驗(yàn)室,其中的關(guān)鍵技術(shù)之一是人形機(jī)器人防爆問(wèn)題,F(xiàn)有防爆多是外掛或穿戴式,與機(jī)器人輕量化相矛盾,軟通天匯通過(guò)材料、電機(jī)等做了結(jié)構(gòu)性?xún)?yōu)化。同時(shí),實(shí)驗(yàn)室中也在開(kāi)展復(fù)雜動(dòng)作研發(fā),涉及多模態(tài)識(shí)別、技能訓(xùn)練。
不過(guò),更多企業(yè)采取了“沿途下蛋”策略。“具身智能不只是賦能于人形機(jī)器人,也可以賦能于多種形態(tài)的智能裝備。”雒冬梅說(shuō)。她看到今年一些大型企業(yè),已在一些具體場(chǎng)景中,提出強(qiáng)烈訴求。軟通天樞聯(lián)合生態(tài)伙伴,也推出了巡檢復(fù)合機(jī)器人、勘測(cè)復(fù)合機(jī)器人、測(cè)量放線(xiàn)復(fù)合機(jī)器人和天匯Phyxis平臺(tái)。
“從大模型到本體到控制到場(chǎng)景,人形機(jī)器人和工業(yè)機(jī)器人不一樣,靠任何一家公司是搞不定的,它必須是一個(gè)大的生態(tài),然后整個(gè)產(chǎn)業(yè)鏈一塊配合。”北京通用人工智能研究院院長(zhǎng)朱松純說(shuō)。
近些年,國(guó)家在頂層設(shè)計(jì)上對(duì)具身智能做了很多的布局和政策引導(dǎo),人形機(jī)器人產(chǎn)業(yè)鏈因多年布局已逐漸成熟。上游關(guān)鍵零部件如機(jī)械臂、關(guān)節(jié)、絲杠等,國(guó)內(nèi)具備一定實(shí)力,供應(yīng)穩(wěn)定;中游大模型、操作系統(tǒng)、機(jī)器人“大腦小腦”、仿真訓(xùn)練企業(yè),則在搶占行業(yè)垂類(lèi)賽道,才能發(fā)揮更大優(yōu)勢(shì);下游各類(lèi)人形機(jī)器人公司,多在2021年后創(chuàng)立。
“對(duì)人形機(jī)器人的發(fā)展不能期望太高、太快,因?yàn)榇蟊妼?duì)人工智能的理解,總是在某些熱點(diǎn)上,一旦熱點(diǎn)來(lái)了,以為馬上就到了。但如果沒(méi)有馬上達(dá)到他的預(yù)期,他的態(tài)度馬上又翻轉(zhuǎn)到另一邊去了。”朱松純說(shuō)。而相比這樣的情緒起伏,行業(yè)需要一個(gè)比較穩(wěn)定、長(zhǎng)期的發(fā)展環(huán)境。
“過(guò)高的期望會(huì)損害這個(gè)產(chǎn)業(yè),因?yàn)榇_實(shí)還沒(méi)到那個(gè)成熟度。”智源研究院王仲遠(yuǎn)說(shuō),“現(xiàn)在有些不切實(shí)際的期待是兩三年后,人形機(jī)器人遍地跑,然后哪都用上。這個(gè)期待恐怕會(huì)落空。”他說(shuō)自己贊同,RoboCup聯(lián)盟預(yù)期的,人形機(jī)器人在2050年之前,戰(zhàn)勝足球世界杯冠軍。