訂閱
糾錯(cuò)
加入自媒體

小鵬人形機(jī)器人,一碗涼粉秀出兩份的量

作者 | 毛心如

一個(gè)走貓步的人形機(jī)器人成功吸引了全球的目光。

這個(gè)機(jī)器人就是 11 月 5 日在小鵬科技日亮相的 IRON。

IRON 的亮相堪稱戲劇性拉滿,小鵬創(chuàng)始人何小鵬面對(duì)機(jī)器人是真人套衣服的質(zhì)疑,既無奈又心酸,不得不一次次公開辟謠、展示機(jī)器人內(nèi)部結(jié)構(gòu)以證清白。

而遠(yuǎn)在大洋彼岸的馬斯克不僅在社交平臺(tái)上公開點(diǎn)贊,并表示 IRON 的造型很不錯(cuò),未來中國和特斯拉將會(huì)主導(dǎo)整個(gè)機(jī)器人市場(chǎng)。

或許辟謠時(shí)心酸的何小鵬,在自證后是樂開了花的,因?yàn)樗虼蟊娮C明了中國制造在現(xiàn)階段的能力。

何小鵬在自證時(shí)感嘆,沒想到要像《讓子彈飛》的情節(jié)一般,通過剖開肚子來證明只吃了一碗粉。

然而,正是這一碗粉里,卻讓人看到了由軟硬件技術(shù)堆出的兩份容量。

找到擬人化的平衡點(diǎn)

有人說,具身智能的第一個(gè)圖靈測(cè)試,是小鵬機(jī)器人 IRON 完成的。工程師得「剖」開機(jī)器人,向大家證明這究竟是人還是機(jī)器人。

大眾拋出懷疑的原因不外乎一點(diǎn),IRON 太像人了。

從本質(zhì)上看,拆解機(jī)器人,其實(shí)是機(jī)器+人,把機(jī)器做的像人。想實(shí)現(xiàn)這個(gè)目標(biāo)有兩條常見思路:

通過內(nèi)部仿生驅(qū)動(dòng),比如人工肌肉,去還原肌肉的運(yùn)動(dòng)學(xué)與觸感

通過外包柔軟的外衣來降低恐怖谷效應(yīng),讓機(jī)器人更「可親」

這兩條路線最典型的實(shí)踐分別是,荷蘭 Clone 研發(fā)的 Protoclone 機(jī)器人和挪威 1X 研發(fā)的 NEO 機(jī)器人。

Protoclone 選擇用人工肌肉替代電機(jī)驅(qū)動(dòng),實(shí)現(xiàn)了仿人機(jī)器人上半身 164 個(gè)自由度,然而,人工肌肉對(duì)材料技術(shù)和液壓系統(tǒng)技術(shù)都有很高的要求,目前其設(shè)計(jì)還不能完全調(diào)教好這兩點(diǎn)。

此外,完全以人類肌腱形態(tài)進(jìn)行復(fù)刻設(shè)計(jì),雖然在擬人化上能做到高度還原,但是恐怖谷效應(yīng)過大,用戶體驗(yàn)感上并不好。

與此形成對(duì)比的是,1X 為了體現(xiàn)機(jī)器人的安全和親和力,選擇的是外包尼龍等柔軟織物,讓機(jī)器人看起來有柔和感。同時(shí),今年 Figure AI 也在第三代機(jī)器人 F.03 采用了外包織物的思路。

而小鵬選擇的是將這兩條路徑進(jìn)行更有趣的結(jié)合。機(jī)器人的內(nèi)里采用電機(jī)驅(qū)動(dòng)+彈性體連結(jié)的方案,外部用軟織物包裹,讓機(jī)器人實(shí)現(xiàn)剛?cè)岵?jì),既有穩(wěn)定的軀體,也有柔軟觸感。

這套方案里,很關(guān)鍵的一個(gè)材料就是彈性體,在 IRON 里充當(dāng)人類筋膜的結(jié)構(gòu)。

這是一種兼具高彈性和輕量化的高性能材料,其特點(diǎn)是受力后能迅速恢復(fù)原狀,形變可逆性極強(qiáng)。其通過 3D 打印技術(shù)構(gòu)建晶格結(jié)構(gòu),模擬人類肌肉的收縮、緩沖和動(dòng)態(tài)響應(yīng)特性。

像優(yōu)必選 Walker S2 的肘部、智元靈犀 X2 的胳膊、胸甲和腿部以及 Figure 02 的關(guān)節(jié)處緩震肌肉都有采用到這一材料。

當(dāng)然,外皮再柔軟,真正決定感官上像不像人的,還得看機(jī)器人動(dòng)起來能不能像人。

IRON 的貓步是引發(fā)大眾懷疑的最大「導(dǎo)火索」?此坪(jiǎn)單的步態(tài)背后,其實(shí)是小鵬對(duì)于機(jī)械架構(gòu)的再一次升級(jí)。

跟上一代 IRON 相比,這一代在自由度上有了明顯增加,從 62 個(gè)增加到 82 個(gè),同時(shí)新一代 IRON 擁有了仿人脊柱。

在以往人形機(jī)器人設(shè)計(jì)中,軀干往往是剛性設(shè)計(jì),這會(huì)導(dǎo)致上半身的動(dòng)作僵硬,重心控制困難。

而仿人脊柱可以讓機(jī)器人在行走、轉(zhuǎn)向、彎腰時(shí)更自然地分配重心,不只是讓機(jī)器人看起來像人,更能讓動(dòng)作流暢、穩(wěn)定。

具體來講,仿生脊柱有 5 個(gè)自由度,用到了線性執(zhí)行器和球頭萬向節(jié),再結(jié)合換成與 Optimus 一樣 ARF 串聯(lián)結(jié)構(gòu)的髖關(guān)節(jié),IRON 能在外展、旋轉(zhuǎn)、彎曲等動(dòng)作都更加自然。

除了軀干設(shè)計(jì)有了大升級(jí),小鵬在靈巧手上也進(jìn)行了更新升級(jí),其自由度從 15 個(gè)增加到了 22 個(gè),趨近于人手的自由度設(shè)計(jì)。

此外,小鵬自研了 16mm 的諧波關(guān)節(jié),是目前行業(yè)最小的諧波關(guān)節(jié),以實(shí)現(xiàn)靈巧手在性能與尺寸之間的平衡。

IRON 靈巧手大小幾乎跟人手趨同,其采用的是目前行業(yè)內(nèi)最成熟的連桿傳動(dòng)方案,在這其中諧波減速器充當(dāng)關(guān)節(jié)的肌腱,決定動(dòng)作是否精確、平滑。

與汽車端業(yè)務(wù)硬件驅(qū)動(dòng)軟件的邏輯相反,機(jī)器人遵循的是軟件驅(qū)動(dòng)硬件。換句話說,小鵬將 IRON 進(jìn)行升級(jí),是為了去適配更加聰明的軟件大腦。

這一點(diǎn),海內(nèi)外的頭部玩家像 Figure AI、星動(dòng)紀(jì)元,都遵循的「模型算法-硬件參數(shù)」協(xié)同開發(fā)模式,避免通用模型+通用硬件的適配損耗。

更類人的智能化系統(tǒng)

如果說硬件塑造了機(jī)器人的軀體,那么軟件與智能系統(tǒng)則是賦予其生命的關(guān)鍵。

何小鵬在科技日上表示,新一代 IRON 是首款搭載小鵬第一代物理世界大模型的機(jī)器人。

通過構(gòu)建 VLT(Vision-Language-Task)+VLA+VLM 的高階能力組合,7 套系統(tǒng)實(shí)現(xiàn)了對(duì)話、行走和交互三大高階智能。

拆解這套組合,VLT、VLA、VLM 獨(dú)立可以自成一套系統(tǒng),分別對(duì)應(yīng)著大腦、交互和小腦,兩兩組合可以按任務(wù)類型及難度的不同來組合處理,三組模型整合形成系統(tǒng)性的大小腦架構(gòu)。

其中,VLT 大模型是專為機(jī)器人開發(fā)的全新大模型,被視為機(jī)器人自主行動(dòng)的核心引擎,使其能夠?qū)崿F(xiàn)深度思考和自主決策。

小鵬的目標(biāo)是高階人形機(jī)器人,不僅在外觀上仿人,在智能化上也想向人腦類同。雖然功能話術(shù)對(duì)標(biāo)的是人類大小腦,其實(shí)這套架構(gòu)的實(shí)質(zhì)也是機(jī)器人行業(yè)里的講的快慢腦系統(tǒng)。

像 Figure 的 Helix、星動(dòng)紀(jì)元的 ERA-42、星海圖的 G0、星塵智能的 DuoCore 等采用的都是快慢腦系統(tǒng)。

這一系統(tǒng)源于快思慢想理論,其指出人類大腦存在兩個(gè)思維系統(tǒng),分別是快思考和慢思考,將這一理論引入 VLA 模型設(shè)計(jì),目標(biāo)在解決速度與智能的矛盾。

在 VLA 模型里,快腦通常由一個(gè)輕量級(jí)的、獨(dú)立的策略網(wǎng)絡(luò)擔(dān)任,負(fù)責(zé)生成實(shí)時(shí)的、流暢的動(dòng)作。慢腦通常由一個(gè)龐大的、預(yù)訓(xùn)練的 VLM 擔(dān)任,負(fù)責(zé)高級(jí)的場(chǎng)景理解和任務(wù)規(guī)劃。

盡管雙系統(tǒng)顯著提升了機(jī)器人的執(zhí)行效率,但將快腦設(shè)計(jì)成一個(gè)全新的、獨(dú)立于慢腦的模塊,使得它無法直接訪問和利用慢腦內(nèi)部海量的預(yù)訓(xùn)練知識(shí)。

這就會(huì)導(dǎo)致快腦像一個(gè)只聽指令的士兵,而無法理解指令背后的深層含義。

這在某種程度上與人類的思維方式不同,人類的反應(yīng)往往并非嚴(yán)格分段執(zhí)行,行動(dòng)中常夾帶理解與習(xí)慣性的反思。

為此,小鵬在架構(gòu)設(shè)計(jì)上將 VLA 與 VLM 劃分得更為清晰,同時(shí)加入 VLT 來判別任務(wù)的難度,從而為系統(tǒng)提供不同層次的響應(yīng)速度。

同時(shí),這一次小鵬把車端最新的第二代 VLA 復(fù)用在 IRON 上。新一代 VLA 取消了傳統(tǒng) VLA 模型中的語言轉(zhuǎn)譯環(huán)節(jié),實(shí)現(xiàn)視覺信號(hào)到動(dòng)作指令的端到端輸出,降低了信息損失并提升響應(yīng)速度。

具體來說,二代 VLA 選擇再次利用來自 V 的信號(hào),讓 V 信號(hào)和 L 信號(hào)共同對(duì)決策 A 產(chǎn)生作用,從而既利用了 L 的推理能力,又避免了僅僅將 L 作為決策表征時(shí)會(huì)產(chǎn)生從 V 到 L 的轉(zhuǎn)譯過程中的信息損耗。

這樣的架構(gòu)與特斯拉在 ICCV 2025 上分享的架構(gòu)非常相似。

特斯拉是用 V 相關(guān)的多模態(tài)信號(hào)一方面產(chǎn)生 L 作為中間表征,另一方面生成全景分割、3D 高斯表征等比原始多模態(tài)信號(hào)更高維的信號(hào),然后讓這類多模態(tài)感知信號(hào)與 L 的自然語言解釋一起,共同決定輸出的 Action。

小鵬自動(dòng)駕駛團(tuán)隊(duì)成員也曾表示小鵬的二代 VLA 既是 VLA 模型,也是世界模型,小鵬二代 VLA 在用其 VLA 數(shù)據(jù)訓(xùn)練世界模型。

特斯拉也在這么做,其將世界模型與智駕模型做了結(jié)合,將世界模型預(yù)測(cè)的下一步世界狀態(tài)輸入給智駕系統(tǒng),用以對(duì)智駕系統(tǒng)進(jìn)行進(jìn)一步評(píng)估和訓(xùn)練。

作為既造車又造機(jī)器人的企業(yè),小鵬與特斯拉在技術(shù)路徑上有著高度的類同。

不僅體現(xiàn)在車端的智駕系統(tǒng)和自研芯片,也體現(xiàn)在將模型+芯片的技術(shù)體系復(fù)用到機(jī)器人產(chǎn)品中,最大化發(fā)揮技術(shù)協(xié)同優(yōu)勢(shì)。

兩大行業(yè)難題:靈巧手和應(yīng)用場(chǎng)景

盡管小鵬這次的機(jī)器人在軟件和硬件上帶來了一定的全新升級(jí),但其仍然面對(duì)著人形機(jī)器人行業(yè)發(fā)展的兩大難題,一個(gè)是靈巧手,一個(gè)是人形機(jī)器人究竟用在哪里。

雖然新一代 IRON 靈巧手達(dá)到了仿人的自由度,同時(shí)也打造了更小的減速器關(guān)節(jié),但是這只靈巧手在成本和可靠性上仍然存在著大問題。

首先是成本,小鵬機(jī)器人一號(hào)位米良川表示,目前靈巧手的成本占到了整機(jī)成本的 60%,這不僅遠(yuǎn)超行業(yè) 25-35% 的平均水平,距離行業(yè)的理想目標(biāo) 5-10% 更是遙遠(yuǎn)。

何小鵬也表示一只手的成本遠(yuǎn)高于雇傭一名工人一年的成本,而且靈巧手放在工廠里 1 個(gè)月就壞了,高成本并沒有與高可靠性劃上等號(hào)。

這背后的技術(shù)困境在于,高自由度意味著更多電機(jī)、減速器與傳感器,也意味著更多潛在故障點(diǎn)。

當(dāng)然這也是目前行業(yè)的共性問題,既想追求仿人的高自由度,也想追求成本低,同時(shí)又期待產(chǎn)品能夠足夠耐用。

有許多業(yè)內(nèi)人士表示,很多第三方靈巧手廠商的產(chǎn)品大多壽命在 1-3 個(gè)月,有些甚至只有 7 天壽命。

深入來看,機(jī)器人靈巧手平均維護(hù)周期太短,背后指向的整個(gè)行業(yè)的痛點(diǎn):柔性關(guān)節(jié)、微型諧波、線纜管理與熱控制等技術(shù)仍然不成熟。

如果說靈巧手是技術(shù)硬瓶頸,應(yīng)用場(chǎng)景就是商業(yè)化軟難題。

從去年講機(jī)器人進(jìn)廠打螺絲到今年轉(zhuǎn)向「導(dǎo)覽、導(dǎo)購、導(dǎo)巡」的三導(dǎo)場(chǎng)景,小鵬對(duì)機(jī)器人應(yīng)用方向的調(diào)整反映出產(chǎn)業(yè)對(duì)現(xiàn)實(shí)困境的認(rèn)知深化。

何小鵬明確表示,經(jīng)過實(shí)踐驗(yàn)證,他們發(fā)現(xiàn)當(dāng)前的技術(shù)水平下,人形機(jī)器人既不適合進(jìn)入工廠承擔(dān)重復(fù)性的制造任務(wù),也不適合進(jìn)入家庭處理復(fù)雜的家務(wù)勞動(dòng)。

這種坦誠實(shí)際上反映了整個(gè)行業(yè)的難題。

目前來看,人形機(jī)器人在市場(chǎng)上的應(yīng)用仍以娛樂向?yàn)橹鳎叶酁橹行〕叽绠a(chǎn)品;全尺寸人形機(jī)器人在真實(shí)環(huán)境中的投放占比極低,目前真正在工廠投入使用的,僅有優(yōu)必選的 Walker S2。

把視野收窄,橫向?qū)Ρ葟V汽、小鵬和特斯拉這三家自研機(jī)器人的三家車企:

廣汽的 GoMate 原本的投放計(jì)劃也是在工廠,后來發(fā)現(xiàn)不合適,目前應(yīng)用在了安防、巡檢

小鵬的 IRON 原始計(jì)劃是進(jìn)工廠,現(xiàn)在變成了三導(dǎo)服務(wù)場(chǎng)景

特斯拉目前還沒有造出成熟落地的 Optimus 機(jī)器人,如果靈巧手問題解決不了,有可能也應(yīng)用在線下門店

計(jì)劃應(yīng)用場(chǎng)景的變更只是難題的第一點(diǎn),第二點(diǎn)是人形機(jī)器人落地的應(yīng)用價(jià)值有多大。

回顧過去,中國的服務(wù)機(jī)器人早已在導(dǎo)購、導(dǎo)巡等領(lǐng)域應(yīng)用廣泛,如云跡、擎朗等輪式機(jī)器人早已鋪開。

人形機(jī)器人在這些場(chǎng)景中是否有獨(dú)特價(jià)值?目前看,除了更像人帶來的互動(dòng)體驗(yàn)外,并沒有形成強(qiáng)競(jìng)爭(zhēng)壁壘。

以線下門店場(chǎng)景為例,如果只是起到講解的作用,或許銷售會(huì)比人形機(jī)器人講得更全面;如果是陪同體驗(yàn)車輛,那對(duì)機(jī)器人的性能要求更高,例如開車門、坐進(jìn)車?yán)镏v解,需要關(guān)節(jié)和靈巧手都?jí)蜢`活。

在博物館等場(chǎng)景,場(chǎng)景相對(duì)比較單一,而且場(chǎng)地空曠,但是完全保證人機(jī)安全,同時(shí)也要保證人機(jī)交互的舒適也是問題。

如果機(jī)器人為了避讓觀眾而頻繁調(diào)整路線,或是讓觀眾主動(dòng)避讓,又或是互動(dòng)過程中出現(xiàn)卡頓,反而難以達(dá)到理想的服務(wù)效果。

小鵬 IRON 的亮相如同一面行業(yè)鏡子,既能照見全球技術(shù)新的探索成果,也映照出行業(yè)的階段性困境。

當(dāng)前全球人形機(jī)器人行業(yè)處于技術(shù)路線收斂、成本快速下降、應(yīng)用場(chǎng)景拓展的階段,2025 年更是被視為量產(chǎn)元年,全球?qū)⒂腥f臺(tái)以上的人形機(jī)器人量產(chǎn)出貨。

在這個(gè)關(guān)鍵節(jié)點(diǎn),在技術(shù)與量產(chǎn)井噴式爆發(fā)的一年,大眾的心理閾值一直被拉高,不夠吸睛就會(huì)喪失流量和關(guān)注度。熱烈的討論背后,技術(shù)的還不夠完美也需要理性看待。

但人形機(jī)器人的技術(shù)發(fā)展從來不是孤立的技術(shù)競(jìng)賽,而是全球行業(yè)協(xié)同進(jìn)化。新一代 IRON 的探索正體現(xiàn)了既借鑒全球先進(jìn)經(jīng)驗(yàn),又結(jié)合自身優(yōu)勢(shì)本土化創(chuàng)新的路徑。

對(duì)于所有具身智能玩家而言,其實(shí)無需刻意預(yù)測(cè)行業(yè)拐點(diǎn),更重要的是沉下心做好技術(shù)積累,為拐點(diǎn)的到來做好充分準(zhǔn)備。

不完美的探索,恰恰是走向拐點(diǎn)的必經(jīng)之路。

       原文標(biāo)題 : 小鵬人形機(jī)器人,一碗涼粉秀出兩份的量

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)