职位描述
1. 基于强化学习的人形机器人(轮式/轮足/双足)运动控制算法研究与实现,包括行走、操作、跑步、跳跃等动态运动技能的训练与部署。
2. 设计并优化Sim-to-Real迁移策略,解决仿真与真实机器人之间的动力学差异(domain gap),针对机器人本体特性提出算法与机电协同设计的改进建议。
3. 构建强化学习训练框架(如Isaac Gym、Mujoco + RLlib等),探索强化学习与传统控制融合、大小脑算法融合。
4. 参与机器人运动学、动力学模型的搭建与仿真环境构建,建立基于强化学习的运动性能评估标准,与传统控制方法性能做对比。
5. 跟踪前沿强化学习算法(如PPO、SAC、TD3、Dropout Q-learning等)及机器人运动控制领域最新成果,进行技术文献调研与原型实现。