訂閱
糾錯(cuò)
加入自媒體

格斗大賽出圈!人形機(jī)器人致命短板曝光:頭腦過于簡單

2025-05-27 09:14
雷科技
關(guān)注

距離成熟起碼還有五年?

別看博茨大戰(zhàn)了,CMG才是真男人該看的比賽。

作為目前全球熱度最高的機(jī)器人格斗比賽,連續(xù)舉辦了20多年的博茨大戰(zhàn)已成一代人的回憶。然而該比賽中出場的機(jī)器人基本為輪足類型,攻擊方式較為單一,能夠點(diǎn)燃觀眾的激情,卻難以做出復(fù)雜操作。

日前,由中央廣播電視總臺(tái)主辦的全球首個(gè)人形機(jī)器人格斗大賽《CMG 世界機(jī)器人大賽·系列賽》機(jī)甲格斗擂臺(tái)賽隆重開幕,宇樹科技旗下的人形機(jī)器人Unitree G1亮相,一場充滿科幻感的比賽瞬間引發(fā)熱議。

2025052613432670905.jpg

(圖源:央視)

今年4月北京人形機(jī)器人半程馬拉松比賽舉辦之時(shí),未參賽的宇樹科技表示,正在為人形機(jī)器人格斗大賽做準(zhǔn)備,故而沒有親自去參加該賽項(xiàng)。半程馬拉松主要考驗(yàn)人形機(jī)器人的穩(wěn)定性和續(xù)航能力,格斗大賽對于機(jī)器人的平衡性、靈活程度則是全方位的考驗(yàn),二者的差距宛如中考和高考。

人形機(jī)器人行業(yè)究竟發(fā)展到了什么程度,在這場比賽中直觀展現(xiàn)了出來。

電機(jī)、算法立功,機(jī)器人上演“李小龍附體”?

格斗比賽中的拳擊和踢腿等動(dòng)作,都伴隨著重心的偏移,擊中目標(biāo)后產(chǎn)生的反作用力,也可能導(dǎo)致機(jī)器人重心不穩(wěn),對于機(jī)器人是一場嚴(yán)峻的考驗(yàn)。

CMG參賽選手Unitree G1在比賽中的確出現(xiàn)了幾次攻擊時(shí)未擊中對手,反而自己摔倒的情況,但穩(wěn)定性和平衡性依然超出了小雷的預(yù)期。例如下圖的對決畫面,雙方抱拳防御姿態(tài)稍作試探后側(cè)踢對方腹部,雖然都出現(xiàn)了重心不穩(wěn)的跡象,但很快恢復(fù)了穩(wěn)定性,并后撤拉開距離,調(diào)整姿態(tài)正面對手。

踢腿_compressed.gif

(圖源:央視)

在受到攻擊倒下后,Unitree G1僅需不到5秒便成功站起,起身動(dòng)作與人類無異,會(huì)使用單手撐地姿勢,甚至因感知不到疼痛更為流暢和迅速。

起身_compressed.gif

(圖源:央視)

Unitree G1穩(wěn)定性、平衡性、靈活性均表現(xiàn)出色的關(guān)鍵,在于行業(yè)頂尖的軟硬件能力。硬件層面,Unitree G1搭載的深度相機(jī)和3D激光雷達(dá)能夠準(zhǔn)確感知自身狀態(tài),標(biāo)準(zhǔn)版23個(gè)、EDU版23-43個(gè)關(guān)節(jié)電機(jī),賦予了Unitree G1極強(qiáng)的靈活性,其中單手臂配有3個(gè)肩關(guān)節(jié)、2個(gè)肘關(guān)節(jié)、2個(gè)腕關(guān)節(jié),單腿配備了3個(gè)髖關(guān)節(jié)、1個(gè)膝關(guān)節(jié)、2個(gè)踝關(guān)節(jié)。

控制人形機(jī)器人運(yùn)動(dòng)的電機(jī),在人形機(jī)器人各零部件成本中可以排到第二或第三,一般只有力矩傳感器成本高于電機(jī)。Unitree G1搭載的電機(jī)為自研內(nèi)轉(zhuǎn)子無刷電機(jī),能夠提供更強(qiáng)的功率密度和控制精度,使用壽命相較有刷電機(jī)更長。

關(guān)于機(jī)器人液壓和電機(jī)哪個(gè)方案好,行業(yè)曾爭論不休,如今電機(jī)方案勝過液壓方案幾乎已成共識(shí),就連液壓方案的忠實(shí)擁躉波士頓動(dòng)力,也轉(zhuǎn)向電機(jī)方案。

高達(dá)數(shù)十個(gè)的電機(jī),讓Unitree G1各處關(guān)節(jié)都極為靈活,但也需要一套方案用于控制各處電機(jī)協(xié)同工作。

52688de58de044358e4792a5b7c1593d_2740x1720.jpg

(圖源:宇樹科技)

為解決這一難題,宇樹科技與上海人工智能實(shí)驗(yàn)室、上海交通大學(xué)聯(lián)合開發(fā)了具身智能控制學(xué)習(xí)算法HoST,通過多評(píng)判強(qiáng)化學(xué)習(xí)、平滑正則化、隱式速度約束三大模塊,對機(jī)器人的能量效率、關(guān)節(jié)負(fù)荷進(jìn)行評(píng)估,并通過約束空間連續(xù)性減少機(jī)器人在運(yùn)動(dòng)過程中的高頻抖動(dòng)情況,相較傳統(tǒng)方法可將運(yùn)動(dòng)震蕩幅度降低60%以上。

強(qiáng)化學(xué)習(xí)策略引入的物理引擎動(dòng)力學(xué)方程,則能對機(jī)器人的關(guān)節(jié)加速度和最大速度進(jìn)行限制,以符合硬件的性能邊界,從而實(shí)現(xiàn)負(fù)重狀態(tài)和復(fù)雜環(huán)境下保持平衡,能夠以28種姿勢站立。

憑借IMU(慣性測量單元)實(shí)時(shí)監(jiān)測機(jī)器人的姿勢和狀態(tài),并通過算法高效控制機(jī)器人的數(shù)十個(gè)關(guān)節(jié),是Unitree G1在格斗比賽中能夠長時(shí)間保持穩(wěn)定,施展出專業(yè)格斗技巧的關(guān)鍵。但這并不意味著Unitree G1足夠完美,恰恰相反,Unitree G1最重要的問題仍難以解決。

四肢足夠發(fā)達(dá),大腦依舊簡單

在部分網(wǎng)友為CMG比賽中機(jī)器人的操作感到振奮之時(shí),也有一些網(wǎng)友認(rèn)為其噱頭大于實(shí)際,因?yàn)閰①悪C(jī)器人并非根據(jù)程序和指令自動(dòng)對戰(zhàn),需要工作人員使用手柄遙控。

據(jù)《科創(chuàng)板日報(bào)》報(bào)道,宇樹科技機(jī)器人使用的格斗動(dòng)作,采集自外部人員的數(shù)據(jù),供AI大模型學(xué)習(xí)和參考,內(nèi)嵌算法由比賽團(tuán)隊(duì)自研,復(fù)雜操作需要現(xiàn)場手柄操控。正因如此,比賽中多次出現(xiàn)略顯滑稽的畫面,例如兩個(gè)機(jī)器人對著空氣瘋狂輸出,還有多次主動(dòng)攻擊時(shí)重心不穩(wěn)跌倒的情況。

空氣_compressed.gif

(圖源:央視)

《科創(chuàng)板日報(bào)》稱,多名業(yè)內(nèi)人士表示,機(jī)器人的底層算法已經(jīng)較為出色,但缺乏真正的空間智能大模型作為機(jī)器人的大腦。

嚴(yán)格來說,輪足機(jī)器人在續(xù)航和穩(wěn)定性兩方面,都勝過兩足機(jī)器人。企業(yè)費(fèi)盡心思打造兩足機(jī)器人,原因在于兩足機(jī)器人更接近人。訓(xùn)練AI大模型需要大量數(shù)據(jù),兩足機(jī)器人可用人類的日常動(dòng)作影像數(shù)據(jù)進(jìn)行訓(xùn)練。

現(xiàn)在的問題是,機(jī)器人所用的基礎(chǔ)算法和硬件,愈發(fā)趨于成熟,應(yīng)用于機(jī)器人的AI大模型卻遠(yuǎn)遠(yuǎn)不夠成熟。今年3月AI企業(yè)Anthropic聯(lián)合創(chuàng)始人兼政策主管Jack Clark表示,機(jī)器人行業(yè)即將進(jìn)入類似生成式AI模型的早期發(fā)展階段,即GPT-2時(shí)期。

參考ChatGPT的發(fā)展歷程,適用于機(jī)器人的AI大模型可能還需要一年時(shí)間才能達(dá)到「能用」級(jí)別,三年左右時(shí)間,才能達(dá)到「好用」級(jí)別。

進(jìn)入2025年后,國內(nèi)外企業(yè)陸續(xù)推出了適用于機(jī)器人的AI大模型,例如谷歌Gemini Robotics和Gemini Robotics-ER、Figure AI的Helix等,不僅可實(shí)現(xiàn)對設(shè)備關(guān)鍵軀體的高速率連續(xù)控制,還能讓機(jī)器人操作從未見過的物品。

國內(nèi)機(jī)器人企業(yè)智元機(jī)器人則發(fā)布了首個(gè)通用具身基座模型——啟元大模型,該模型基于ViLLA架構(gòu),融合多模態(tài)大模型和混合專家架構(gòu),可借助人類視頻進(jìn)行訓(xùn)練,具備小樣本快速泛化能力,執(zhí)行五種復(fù)雜任務(wù)的平均成功率提高了32%。

7b075f2888362752b9ad2ed3d0069360.jpg

(圖源:智元機(jī)器人)

Unitree G1接入的UnifoLM,則是宇樹科技自主研發(fā)的AI大模型,具有多模態(tài)感知能力,可根據(jù)視覺圖像識(shí)別物體的形狀、位置、顏色,并通過自動(dòng)決策能力規(guī)劃抓取路徑,抓取過程中也可以根據(jù)力覺傳感器反饋的數(shù)據(jù)調(diào)整力度,避免損壞物品,并節(jié)省能耗。

不過正如Jack Clark所言,適用于機(jī)器人的AI大模型還需要較長時(shí)間才能成熟。宇樹科技創(chuàng)始人王興興去年8月曾表示,機(jī)器人大模型路線不像大語言模型那么明確,企業(yè)都有使不上力的感覺,投入再多錢也很難取得太大的成果,因而行業(yè)在其中的研發(fā)投入較為克制,可能需要一絲運(yùn)氣,需要一位天才人物來推動(dòng)。

適用于機(jī)器人的AI大模型不夠成熟,導(dǎo)致機(jī)器人在特定場景下可以完成指定任務(wù),卻無法快速實(shí)現(xiàn)泛化,向更多任務(wù)拓展。機(jī)器人格斗大賽這種場景,遙控比AI大模型更可靠。機(jī)器人行業(yè)的復(fù)雜性,又讓許多企業(yè)不敢投入太多資金研發(fā)大模型。

好在,這個(gè)行業(yè)不乏勇于嘗試的企業(yè),國內(nèi)外已有大量企業(yè)入局,部分企業(yè)如啟元大模型一般開源AgiBot World數(shù)據(jù)集、工具鏈、預(yù)訓(xùn)練模型,加快推動(dòng)行業(yè)成熟。機(jī)器人AI大模型正處于快速發(fā)展期,任何企業(yè)都有成為機(jī)器人行業(yè)OpenAI、DeepSeek的可能性。

機(jī)器人距離成熟,至少還差五年?

盡管CMG大賽上,Unitree G1出現(xiàn)了幾次重心不穩(wěn)摔倒的畫面,但整體平衡性已經(jīng)超出了小雷的預(yù)期,尤其是摔倒后流暢起身的動(dòng)作,與人類幾乎沒有差別。

Unitree G1的缺點(diǎn)也很明顯,依賴手柄操作令消費(fèi)者對其實(shí)用性和比賽的意義產(chǎn)生了質(zhì)疑。實(shí)際上,Unitree G1支持遙控、語音控制、體感控制三種操作模式,但語音控制延遲太高,在格斗比賽中很難起到作用,宇樹科技已經(jīng)開發(fā)出了一套體感控制系統(tǒng),后續(xù)比賽可能會(huì)用上。

QQ截圖20250526180259.png

(圖源:央視)

萬丈高樓始于壘土,Unitree G1在格斗大賽上的表現(xiàn),雖然無法讓所有人滿意,但技術(shù)就是在一次次嘗試中走向成熟。2025年被稱為人形機(jī)器人量產(chǎn)元年,國內(nèi)的宇樹科技、智元機(jī)器人、優(yōu)必選等企業(yè),都在為大規(guī)模量產(chǎn)做準(zhǔn)備,王興興在去年8月的采訪中預(yù)測,機(jī)器人行業(yè)距離「iPhone時(shí)刻」不會(huì)超過5年。

大量機(jī)器人AI大模型的涌現(xiàn),也將起到加快機(jī)器人行業(yè)成熟的效果,或許用不了幾年,人形機(jī)器人的價(jià)格就會(huì)下降到普通消費(fèi)者可以接受的范圍,功能也將滿足我們生活場景的部分需求。

至于人形機(jī)器人格斗大賽,對于企業(yè)而言是一次檢驗(yàn)機(jī)器人產(chǎn)品質(zhì)量的技術(shù)實(shí)力的機(jī)會(huì)。博茨大戰(zhàn)證明,關(guān)注此類比賽的人不在少數(shù),提前布局有機(jī)會(huì)吃到更多流量,增加品牌人氣。待體感控制上線后,參賽者可以如科幻電影一般控制機(jī)器人,也將大幅增加比賽的觀賞性和話題性。

    來源:雷科技

           原文標(biāo)題 : 格斗大賽出圈!人形機(jī)器人致命短板曝光:頭腦過于簡單

    聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報(bào)。

    發(fā)表評(píng)論

    0條評(píng)論,0人參與

    請輸入評(píng)論內(nèi)容...

    請輸入評(píng)論/評(píng)論長度6~500個(gè)字

    您提交的評(píng)論過于頻繁,請輸入驗(yàn)證碼繼續(xù)

    • 看不清,點(diǎn)擊換一張  刷新

    暫無評(píng)論

    暫無評(píng)論

      掃碼關(guān)注公眾號(hào)
      OFweek人工智能網(wǎng)
      獲取更多精彩內(nèi)容
      文章糾錯(cuò)
      x
      *文字標(biāo)題:
      *糾錯(cuò)內(nèi)容:
      聯(lián)系郵箱:
      *驗(yàn) 證 碼:

      粵公網(wǎng)安備 44030502002758號(hào)