职位描述
1、面向具身智能应用场景,开展 Vision–Language–Action(VLA)模型的研究与实现,构建感知—理解—决策—动作的端到端闭环能力。
2、设计并优化多模态感知与指令理解模型,实现语言指令驱动的复杂动作规划与执行。
3、探索 VLM / LLM 与低层控制、技能库、策略网络的高效耦合方式,提升系统整体智能水平。
4、在仿真与真实机器人平台(移动机器人、机械臂、无人系统等)上开展算法验证与系统集成。
5、跟踪、复现并推进具身智能、多模态大模型与机器人学习方向的前沿研究成果。