应用场景:

多自由度机器人、双足、四足仿生机器人的决策规划




机器人仿真软件:

mojuco, vrep, gazebo, NVIDIA Isaac

Mujoco/Bullet/Webots/Gazebo/CoppeliaSim/Isaac

仿真软件(如Adams/Gazebo)




常用的深度强化学习算法:

DQN、DDPG、A3C等