訂閱
糾錯
加入自媒體

ECCV 2020 | 基于對抗路徑采樣的反事實視覺語言導航

為了提升對于未知環(huán)境的適應性,預探索也被應用到了整套系統(tǒng)中去。導航器可以首先探索不熟悉的環(huán)境,并增加在未知環(huán)境中執(zhí)行導航指令的機會。針對先前的預探索方法,像束搜索和自模仿學習,他們基于指令并對每一條指令進行優(yōu)化,但這種方法會造成路徑過長。在真實環(huán)境中部署機器人到陌生環(huán)境時,首先要熟悉環(huán)境并有效地在環(huán)境中執(zhí)行自然語言指令。

與先前方法優(yōu)化給定指令或假設一次性覆蓋所有未知環(huán)境不同,本文提出了利用APS方法來實現(xiàn)基于環(huán)境的預探索,可以使得智能體僅僅針對同一環(huán)境中的任務進行環(huán)境預探索,而無需先驗知識。在未知環(huán)境中,利用APS來采樣多條路徑P’并生成導航指令I’。隨后利用(P’,I’)來優(yōu)化位置環(huán)境中的NAV。在預探索過程中,固定APS參數(shù)而僅僅優(yōu)化NAV。通過這樣的方法可以有效提升模型對于未知環(huán)境的適應能力。

未知環(huán)境中的預探索優(yōu)化流程。APS對未知環(huán)境進行采樣來優(yōu)化NAV。

二、實驗結果

為了驗證這種方法的有效性,研究人員在視覺語言導航數(shù)據(jù)集R2R(Room-to-Room)上進行了實驗。實驗分別針對Seq2Seq、Speaker-Follower、RCM等三個基準進行,分別為其增加隨機采樣增強路徑、APS采樣增強路徑觀察導航誤差(Navigation Error)、成功率(Oracle Success Rate,Success Rate)、路徑長度加權的成功率(Success Rate weighted by Path Length),其結果如下表所示:

可以看到基于APS的方法顯著地提升了三種基準的性能,下圖還更為直觀地反映了隨機采樣和APS增強采樣模式針對兩種方法在不同增強率下性能提升:

下圖還展示了預探索策略對于未知環(huán)境導航的有效性,可以看到經過預探索后導航模型可以根據(jù)指令徑直向前,方向和移動過程更為準確。研究人員還發(fā)現(xiàn)在差異較大的環(huán)境中,預探索能顯示出的能力也就越強,在實際使用中就會具有更強的適應性和泛化性。

如果想要了解更多的實現(xiàn)細節(jié)和實驗結果分析比較,請參看論文,其中不僅包含了充分的理論分析和模型的詳盡實現(xiàn)細節(jié),同時還涵蓋了完整的消融性分析結果。

關于我“門”

將門是一家以專注于發(fā)掘、加速及投資技術驅動型創(chuàng)業(yè)公司的新型創(chuàng)投機構,旗下涵蓋將門創(chuàng)新服務、將門技術社群以及將門創(chuàng)投基金。將門成立于2015年底,創(chuàng)始團隊由微軟創(chuàng)投在中國的創(chuàng)始團隊原班人馬構建而成,曾為微軟優(yōu)選和深度孵化了126家創(chuàng)新的技術型創(chuàng)業(yè)公司。

將門創(chuàng)新服務專注于使創(chuàng)新的技術落地于真正的應用場景,激活和實現(xiàn)全新的商業(yè)價值,服務于行業(yè)領先企業(yè)和技術創(chuàng)新型創(chuàng)業(yè)公司。

將門技術社群專注于幫助技術創(chuàng)新型的創(chuàng)業(yè)公司提供來自產、學、研、創(chuàng)領域的核心技術專家的技術分享和學習內容,使創(chuàng)新成為持續(xù)的核心競爭力。

將門創(chuàng)投基金專注于投資通過技術創(chuàng)新激活商業(yè)場景,實現(xiàn)商業(yè)價值的初創(chuàng)企業(yè),關注技術領域包括機器智能、物聯(lián)網、自然人機交互、企業(yè)計算。在近四年的時間里,將門創(chuàng)投基金已經投資了包括量化派、碼隆科技、禾賽科技、寬拓科技、杉數(shù)科技、迪英加科技等數(shù)十家具有高成長潛力的技術型創(chuàng)業(yè)公司。

<上一頁  1  2  3  
聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關注公眾號
    OFweek人工智能網
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號