Paper/Reinforcement Learning
-
Relay Policy Learning (RPL) 리뷰Paper/Reinforcement Learning 2019. 11. 28. 17:24
Relay Policy Learning RPL 논문 을 번역하며 요약해보았다. Introduction multi-stage, long-horizon robotic tasks 를 해결하기 위한 Relay policy Learning (RPL) 방법을 제안했고 2 phase로 되어있다. Goal conditioned hierarchical policy를 생성하는 Relay Imitation Learning(RIL) stage 생성된 Policy를 fine tuning 하는 Relay Reinforcement Fine tuning(RRF) stage 기존의HRL은 temporal abstraction을 도입하므로써 long-horizon problem을 풀 수 잇는 실마리를 제공했다. 하지만 아래와 같은 pr..