AI浪潮如何賦能人形機器人?
8月16日至21日,2023世界機器人大會在北京舉行。大會期間,北京市政府發(fā)布了《北京市機器人產業(yè)創(chuàng)新發(fā)展行動方案(2023—2025年)》,提出著眼世界前沿技術和未來戰(zhàn)略需求,加緊布局人形機器人,帶動醫(yī)療健康、協作、特種、物流四類優(yōu)勢機器人產品躍升發(fā)展。
機器人的應用場景可謂極其廣泛,人形機器人自然也不例外,在小米集團高級副總裁曾學忠的設想里,未來的智能制造體系中,70%的工作由自動化設備來完成;20%應當由仿真機器人來完成;剩下的10%需要人來完成。
今年以來,在AI浪潮的推動下,AI+人形機器人帶來的“具身智能”受到了市場關注。工業(yè)和信息化部副部長徐曉蘭表示,以人形機器人和通用人工智能為代表的新技術、新產品、新業(yè)態(tài)蓬勃發(fā)展,正成為全球科技創(chuàng)新的制高點。
01
人形機器人前景廣闊
機器人的發(fā)展跟隨制造業(yè)自動化程度不斷提升,從最早的單任務起重機式臂到機器人,再到能夠與人直接交互的協作機器人,再發(fā)展到與人工智能結合的人形機器人。
受全球勞動力缺口持續(xù)擴大影響,人形機器人替代帶動巨大市場需求,東吳證券預計,在特斯拉人形機器人標桿引領作用下,全球在2025年初步實現人形機器人商業(yè)化,實現銷量2萬-3萬臺。到2030年,新增需求100萬臺,2035年銷量有望突破1000萬臺。
隨著人形機器人技術的不斷發(fā)展和應用場景的不斷拓展,市場規(guī)模有望不斷擴大,其中,核心零部件方向是多家機構預計受益的重點方向。具體而言,人形機器人身體核心零部件可以分為諧波減速器、行星滾柱絲杠、伺服電機三部分;手部核心零部件可以分為空心杯電機、微型行星齒輪箱兩部分。
結合2030年人形機器人需求數量,西南證券測算,五大核心零部件的市場空間于2030年市場規(guī)模如下:
1)諧波減速器:單臺機器人諧波減速器數量為14個,2030年單價有望降到600元,樂觀/中性/悲觀情景下市場空間分別為168/126/67億元;
2)行星滾柱絲杠:單臺機器人行星滾柱絲杠數量為14個,2030年單價有望降到2000元,樂觀/中性/悲觀情景下市場空間分別為560/420/224億元;
3)伺服電機:單臺機器人伺服電機數量28個,2030年單價有望降到300元,樂觀/中性/悲觀情景下市場空間分別為168/126/67億元。
4)空心杯電機:單臺機器空心杯電機數量為12個,2030年單價有望降到400元,樂觀/中性/悲觀情景下市場空間分別為96/72/38億元;
5)微型行星齒輪箱:單臺機器人行星滾柱絲杠數量為12個,2030年單價有望降到200元,樂觀/中性/悲觀情景下市場空間分別為48/36/19億元。
據國際機器人協會預測,2021年到2030年,全球人形機器人市場規(guī)模年復合增長率將高達71%。中國電子學會數據顯示,到2030年,我國人形機器人市場規(guī)模有望達到約8700億元。
02
AI如何賦能“具身智能”?
從產業(yè)角度考慮,人形機器人是AI和機器人兩大產業(yè)的共同發(fā)展方向,是技術、制造、服務三個核心能力的交匯點,也是軟硬件跟AI技術融合的制高點。目前,人形機器人的硬件主要包括五部分:
1)感知系統,相當于機器人的“五官”,包括聲音、光、溫度、壓力、定位、接觸等傳感器,用以將外部環(huán)境信號轉換為機器人可以理解的信息或數據;2)驅動系統,相當于機器人的“肌肉”,電機驅動包括電機、減速器、編碼器等;3)末端執(zhí)行系統,相當于機器人的“手”,用以和外界環(huán)境進行交互;4)能源供應,電源或電池;5)運算系統及軟件,相當于機器人的“大腦”。
各大科技巨頭紛紛推出AI大模型,有望解決人形機器人的通用性問題。AI大模型對人形機器人的賦能可以從語音、視覺、決策、控制等多方面實現,形成感知、決策、控制閉環(huán),使機器人具備常識。國泰君安認為,具體可以分為三個方向:
1)語音:語言大模型為機器人的自主語音交互難題提供了解決方案,在上下文理解、多語種識別、多輪對話、情緒識別、模糊語義識別等通用語言任務上,ChatGPT顯著優(yōu)于深度學習,表現出了不亞于人類的理解力和語言生成能力。
2)視覺:人形機器人的場景相對工業(yè)機器人更通用、更復雜,通用視覺大模型的All in One的多任務訓練方案能使得機器人更好地適應人類生活場景。大模型的強擬合能力使人形機器人在進行目標識別、避障、三維重建、語義分割等任務時,具備更高的精確度;通用視覺大模型通過大量數據學到更多的通用知識,并遷移到下游任務中,基于海量數據獲得的預訓練模型具有較好的知識完備性,提升場景泛化效果。
3)決策:基于多模態(tài)的預訓練大模型將增強機器人可完成任務的多樣性與通用性,讓其不局限于文本和圖像等單個部分,而是多應用相容,拓展單一智能為融合智能,使機器人能結合其感知到的多模態(tài)數據實現自動化決策。
03
多個難題依舊待解
在AI浪潮下,2023年,人形機器人受到了不同以往的密集關注,商業(yè)化落地的大方向是有的,但目前,產業(yè)發(fā)展還面臨著諸多挑戰(zhàn)。
清華大學交叉信息研究院院長姚期智指出,目前人形機器人還面臨三個發(fā)展問題:首先,機器人還需要像大語言模型一樣擁有一個具身模型,一步到位做好最底層的控制;其次,在計算能力方面,即使是谷歌的Robotic Transformer模型,也只能達到3個赫茲水平,距離真正需要的500個赫茲還有很大差距;此外,機器人多模態(tài)的感官感知融合和數據收集方面,還有大量的挑戰(zhàn)和問題。
在AI部分,通用大模型本身并不是給通用人形機器人使用的,即使目前通用大模型已經能很好地處理文本或者基本文字邏輯,但是它對環(huán)境的認知和感知能力基本是零,無法認知物理環(huán)境,也沒法抓取做操作,需要新的模型來訓練。
除此之外,硬件性能與成本的平衡也是一大問題。
星動紀元創(chuàng)始人陳建宇表示,對硬件來說,行業(yè)希望機器人同時兼顧力量、速度、精度以及成本,但是目前所有技術都無法同時兼顧這幾項,例如液壓的技術速度和力量都很強,但是它成本太貴。
而高減速比諧波技術,可能精度比較高,但是靈巧性又降低;而新的轉制期技術雖然成本比較低,但是卻犧牲了載荷和精度,因此現在還沒有一個能夠兼顧所有達到滿意的情況。
至于“具身智能”真正落地的時間,陳建宇表示,當前人形機器人、通用機器人還處于一個剛剛開始的階段,問題不會很快得以解決,這是比較長期的過程,可能是5-10年,也可能更長。
原文標題 : AI浪潮如何賦能人形機器人?

請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達AI統治的開始
- 2 北電數智主辦酒仙橋論壇,探索AI產業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關稅,能否乘機器人東風翻身?