任务是地图里面导航,让agent从起始点到达指定位置。
用了supervised learning + reinforcement learning + lstm
用supervised learning当做辅助训练,加速rl训练,用lstm当做memory。实验表明depth construction比较有用。论文中的方法在固定地图和随机地图中都能用。
黄世宇/Shiyu Huang's Personal Page:https://huangshiyu13.github.io/
wx62d12289ce45b ©著作权
任务是地图里面导航,让agent从起始点到达指定位置。
用了supervised learning + reinforcement learning + lstm
用supervised learning当做辅助训练,加速rl训练,用lstm当做memory。实验表明depth construction比较有用。论文中的方法在固定地图和随机地图中都能用。
黄世宇/Shiyu Huang's Personal Page:https://huangshiyu13.github.io/
上一篇:Playing FPS Games with Deep Reinforcement Learning
下一篇:Loss is its own Reward: Self-Supervision for Reinforcement Learning
举报文章
请选择举报类型
补充说明
0/200
上传截图
格式支持JPEG/PNG/JPG,图片不超过1.9M