walk_these_ways项目学习记录第十篇(通过行为多样性 (MoB) 实现地形泛化)--从仿真到部署
真实传感器先被 StateEstimator 整理成训练同构状态,再由 LCMAgent 按训练时相同的方式拼成 observation,HistoryWrapper 维护 obs_history,student policy 输出动作,DeploymentRunner 把动作发到实机,而 actuator net 则在训练侧负责把仿真中的执行器动力学尽量拉近真实机器人。观测同构命令同构控制链同构
所有评论(0)