优才-具身智能算法研究员(VLA端到端与RL方向)-觅蜂子公司

智元创新(上海)科技股份有限公司| 上海
校招博士
发布于 2026-06-17

职位描述

【方向:VLA端到端模型与RL后训练】 设计并训练视觉-语言-动作多模态Transformer(参考RT-2、Octo、PaLM-E),输入自然语言指令 + 空间Token + 本体感觉,输出离散/连续动作Token(关节角度、末端位姿或扩散策略)。 优化模型在真机上的推理速度与泛化能力,探索不同动作表示与模型压缩技术。 利用仿真环境(Isaac Sim、Mujoco)对VLA模型进行强化学习微调(PPO/SAC/RLPD),解决域迁移导致的分布漂移。 设计域随机化、系统辨识、扰动注入策略,提升策略在真实机器人上的成功率与平滑度。

任职要求

计算机视觉、机器人学、机器学习、图形学等相关专业硕士及以上学历,博士优先。 在以下至少一个方向有深入研究和项目经验: 三维重建/SLAM/3D Gaussian Splatting/物体姿态估计/人体手部重建 模仿学习(BC、ACT、Diffusion Policy)、强化学习(PPO、SAC)、机器人控制(MPC、力控)、VLA架构(RT-2、PaLM-E等) 多模态预训练(CLIP、LLaVA)、大模型微调(LoRA、RLHF)、自动标注、数据合成与数据策略 扎实的编程能力:精通Python,熟悉C++,熟练使用PyTorch/JAX等深度学习框架。 熟悉至少一种仿真器(Isaac Sim、Mujoco、PyBullet)或真实机器人平台。 具备优秀的学习能力、逻辑思维与跨团队协作精神,能够快速将前沿论文转化为可工作的原型。 加分项 有真实机器人(机械臂、人形、四足)部署经验,特别是高复杂度操作任务(装配、双手协作)。 在CVPR/ICCV/ECCV/CoRL/ICRA/RSS/NeurIPS等顶会发表论文,或有高质量开源贡献。 处理过Ego4D、HoloAssist或自采机器人混合数据,有Sim2Real迁移实战经验。 熟悉ROS/ROS2,有实时系统或嵌入式开发经验。

相关职位推荐