Dreamer
-
又快又好的智能主體: 谷歌提出基于世界模型的的大規(guī)模強化學習方法Dreamer
近年來隨著強化學習的發(fā)展,使得智能體選擇恰當行為以實現(xiàn)目標的能力得到迅速地提升。目前研究領域主要使用兩種方法:一種是無模型(model-free)的強化學習方法,通過試錯的方式來學習預測成功的行為,其
-
谷歌提出基于世界模型的的大規(guī)模強化學習方法Dreamer
?近年來隨著強化學習的發(fā)展,使得智能體選擇恰當行為以實現(xiàn)目標的能力得到迅速地提升。目前研究領域主要使用兩種方法
谷歌 2020-03-26