Helix系統(tǒng):感知和動(dòng)作控制技術(shù)將推動(dòng)人形機(jī)器人落地物流場景
芝能科技出品
Figure 推出的 Helix 系統(tǒng)正通過將“視覺-語言-動(dòng)作”模型與先進(jìn)的控制策略相融合,加速人形機(jī)器人在物流行業(yè)中的部署與擴(kuò)展。
Helix 的核心技術(shù)體系,圍繞立體視覺、多尺度表征、自我校準(zhǔn)與高效運(yùn)動(dòng)規(guī)劃,在動(dòng)態(tài)、高復(fù)雜度的現(xiàn)實(shí)任務(wù)中展現(xiàn)了類人水平的適應(yīng)性與操作能力。
借助優(yōu)化的數(shù)據(jù)利用方法與跨機(jī)器人遷移能力,Helix 打破了傳統(tǒng)機(jī)器人對硬件一致性和大量訓(xùn)練數(shù)據(jù)的依賴,為未來具身智能的可規(guī);涞氐於嘶A(chǔ)。
01
Helix的核心感知與控制系統(tǒng)設(shè)計(jì):
融合類人認(rèn)知與工業(yè)效率
Helix 的基礎(chǔ)架構(gòu)圍繞“視覺-語言-動(dòng)作”(VLA)模型構(gòu)建,在此架構(gòu)下,機(jī)器人的感知、理解與執(zhí)行行為成為連續(xù)的閉環(huán)。
其核心子系統(tǒng) System 1(S1)可被視作機(jī)器人“低層神經(jīng)網(wǎng)絡(luò)”,承擔(dān)實(shí)時(shí)感知與動(dòng)作生成。S1 的最新迭代將多個(gè)關(guān)鍵技術(shù)融合進(jìn)系統(tǒng)中,包括隱式立體視覺、多尺度視覺處理、本體感知學(xué)習(xí)與運(yùn)動(dòng)模式生成。
● 隱式立體視覺,精準(zhǔn)三維環(huán)境重建:傳統(tǒng)機(jī)器人感知系統(tǒng);趩文繄D像或顯式雙目立體視覺,但前者難以獲取深度信息,后者則對硬件標(biāo)定依賴極高。
Helix 所采用的隱式立體視覺技術(shù),通過融合多個(gè)時(shí)序圖像幀與傳感器反饋,實(shí)現(xiàn)無需外部校準(zhǔn)的三維空間理解能力。這一機(jī)制不僅提升了深度估計(jì)精度,也顯著提高了對非標(biāo)準(zhǔn)形狀(如軟包裝袋、變形郵袋)的處理可靠性。
● 多尺度視覺表征:兼顧局部細(xì)節(jié)與全局場景:Helix 能在處理物流任務(wù)中同時(shí)感知細(xì)小的局部特征(如條形碼標(biāo)簽的旋轉(zhuǎn)方向)與環(huán)境級信息(如傳送帶的全局路徑與速度),依托的是多尺度視覺處理網(wǎng)絡(luò)。
該網(wǎng)絡(luò)將不同分辨率的圖像特征進(jìn)行融合,使模型能夠精準(zhǔn)理解操作對象在場景中的幾何與語義屬性。
● 學(xué)習(xí)型視覺本體感覺,機(jī)器人之間的自適應(yīng)遷移:在多機(jī)器人部署中,機(jī)械臂微小的裝配偏差或傳感器位置的差異可能引發(fā)系統(tǒng)級誤差。
Helix 在每個(gè)機(jī)器人中嵌入視覺驅(qū)動(dòng)的本體感知模塊,使其能在運(yùn)行時(shí)不斷調(diào)整感知與動(dòng)作策略以適應(yīng)個(gè)體差異。
具體而言,系統(tǒng)利用視覺反饋不斷重建自身關(guān)節(jié)空間與運(yùn)動(dòng)結(jié)果之間的映射關(guān)系,并動(dòng)態(tài)優(yōu)化控制策略,從而實(shí)現(xiàn)設(shè)備級別的在線自校準(zhǔn)。
● 高速運(yùn)動(dòng)模式:壓縮執(zhí)行時(shí)間不犧牲精度:傳統(tǒng)的模仿學(xué)習(xí)常通過將人類動(dòng)作軌跡離散化執(zhí)行以換取穩(wěn)定性。但 Helix 引入了“運(yùn)動(dòng)模式重采樣”技術(shù),使機(jī)器人可以在保持軌跡形狀不變的情況下大幅度提高執(zhí)行速度。
通過對軌跡中低風(fēng)險(xiǎn)區(qū)域進(jìn)行時(shí)間壓縮,系統(tǒng)平均執(zhí)行效率可提升 50%,尤其適用于高速、高通量的包裹分揀作業(yè)。
Helix 的感知與控制系統(tǒng)融合了機(jī)器視覺中的空間建模、多分辨率特征提取與嵌入式本體學(xué)習(xí),實(shí)現(xiàn)了動(dòng)態(tài)環(huán)境下對操作對象的快速理解與高效動(dòng)作生成,為物流行業(yè)中典型的“非結(jié)構(gòu)化、多變物體處理”任務(wù)提供了技術(shù)基礎(chǔ)。
02
從數(shù)據(jù)到部署:
Helix如何實(shí)現(xiàn)低數(shù)據(jù)依賴
與跨設(shè)備可擴(kuò)展性
工業(yè)級人工智能系統(tǒng)面臨的兩個(gè)關(guān)鍵挑戰(zhàn),一是訓(xùn)練數(shù)據(jù)質(zhì)量與效率,二是訓(xùn)練成果在不同硬件平臺間的泛化能力。Helix 在這兩方面均進(jìn)行了系統(tǒng)性的工程優(yōu)化,進(jìn)一步推動(dòng)其在人形機(jī)器人上的實(shí)際部署。
● 精選數(shù)據(jù)訓(xùn)練策略,8小時(shí)演示可達(dá)專家級性能:Helix 放棄了對海量低質(zhì)量示例的依賴,轉(zhuǎn)向精細(xì)策劃的高質(zhì)量人類演示。
這種示范數(shù)據(jù)以“成功執(zhí)行、高效路徑、動(dòng)作穩(wěn)定”為篩選標(biāo)準(zhǔn),并融入失敗案例的對比學(xué)習(xí)機(jī)制,使得模型不僅學(xué)會“怎么做”,也能理解“什么是最優(yōu)”。
通過這種策略,Helix 僅用 8 小時(shí)的人類演示數(shù)據(jù),便能達(dá)到包裹處理任務(wù)中專家級的靈活性與決策水平。
● 從最優(yōu)軌跡中提取泛化策略:為了適應(yīng)現(xiàn)實(shí)中包裹尺寸、形狀、材質(zhì)的變化,Helix 的訓(xùn)練策略重點(diǎn)不是覆蓋所有可能組合,而是提取能泛化的操作原理。
例如,它學(xué)習(xí)如何基于邊緣輪廓和表面材質(zhì)預(yù)測抓取點(diǎn),而非僅記憶特定對象的抓取動(dòng)作。這種方法大幅提高了系統(tǒng)對新場景、新對象的適應(yīng)能力。
● 跨機(jī)器人遷移,視覺驅(qū)動(dòng)的策略映射機(jī)制:由于各機(jī)器人之間在硬件組件上的微差異往往影響控制策略,傳統(tǒng)方案需要針對每臺設(shè)備單獨(dú)調(diào)試。
Helix 引入的視覺本體感知機(jī)制能夠感知并修正各機(jī)器人之間的剛體誤差、傳感器對準(zhǔn)偏差與響應(yīng)時(shí)延。該機(jī)制通過少量環(huán)境交互樣本,在數(shù)分鐘內(nèi)即可實(shí)現(xiàn)策略遷移。
● 面向車隊(duì)部署的架構(gòu)優(yōu)化:在物流中心部署十臺、甚至上百臺機(jī)器人時(shí),系統(tǒng)穩(wěn)定性和一致性要求極高。
Helix 的軟硬件協(xié)同框架支持統(tǒng)一版本管理、策略同步與遠(yuǎn)程更新,結(jié)合本地自我校準(zhǔn)功能,確保不同機(jī)器人在高強(qiáng)度運(yùn)行下維持一致性能。
Helix 通過數(shù)據(jù)驅(qū)動(dòng)策略設(shè)計(jì)與系統(tǒng)級結(jié)構(gòu)調(diào)整,使人形機(jī)器人具備“少量訓(xùn)練-高效執(zhí)行-跨設(shè)備泛化”的能力,突破了傳統(tǒng)機(jī)器人系統(tǒng)在部署與維護(hù)成本上的限制,朝向工業(yè)級可擴(kuò)展自動(dòng)化邁出關(guān)鍵一步。
小結(jié)
在傳統(tǒng)機(jī)器人多依賴結(jié)構(gòu)化環(huán)境與重復(fù)性任務(wù)的背景下,Helix 以高維感知、動(dòng)態(tài)控制與跨設(shè)備泛化能力,率先解決了現(xiàn)實(shí)物流場景中的“復(fù)雜物體+動(dòng)態(tài)操作”難題。其所構(gòu)建的技術(shù)體系,真正讓人形機(jī)器人擁有了在工業(yè)環(huán)境中“像人一樣工作”的能力。
Helix 通過其在數(shù)據(jù)效率、設(shè)備適配和執(zhí)行速度上的突破,為未來人形機(jī)器人在制造、護(hù)理、服務(wù)等更多領(lǐng)域的落地提供了參考。
原文標(biāo)題 : Helix系統(tǒng):感知和動(dòng)作控制技術(shù)將推動(dòng)人形機(jī)器人落地物流場景

發(fā)表評論
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個(gè)字
最新活動(dòng)更多
-
即日-9.16點(diǎn)擊進(jìn)入 >> 【限時(shí)福利】TE 2025國際物聯(lián)網(wǎng)展·深圳站
-
10月23日火熱報(bào)名中>> 2025是德科技創(chuàng)新技術(shù)峰會
-
10月23日立即報(bào)名>> Works With 開發(fā)者大會深圳站
-
10月24日立即參評>> 【評選】維科杯·OFweek 2025(第十屆)物聯(lián)網(wǎng)行業(yè)年度評選
-
11月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會
-
12月18日立即報(bào)名>> 【線下會議】OFweek 2025(第十屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會
推薦專題
- 1 先進(jìn)算力新選擇 | 2025華為算力場景發(fā)布會暨北京xPN伙伴大會成功舉辦
- 2 人形機(jī)器人,正狂奔在批量交付的曠野
- 3 宇樹機(jī)器人撞人事件的深度剖析:六維力傳感器如何成為人機(jī)安全的關(guān)鍵屏障
- 4 解碼特斯拉新AI芯片戰(zhàn)略 :從Dojo到AI5和AI6推理引擎
- 5 AI版“四萬億刺激”計(jì)劃來了
- 6 2025年8月人工智能投融資觀察
- 7 8 a16z最新AI百強(qiáng)榜:硅谷頂級VC帶你讀懂全球生成式AI賽道最新趨勢
- 9 Manus跑路,大廠掉線,只能靠DeepSeek了
- 10 地平線的野心:1000萬套HSD上車