优才-具身智能算法研究员(预训练方向)-觅蜂子公司

智元创新(上海)科技股份有限公司| 上海
校招博士
发布于 2026-06-17

职位描述

【方向:预训练、Omni大模型与数据策略】 利用大规模人类视频(Ego4D、Open X-Embodiment)及无本体交互数据,预训练多模态基座模型(视觉-语言-动作联合),作为VLA主干backbone。 探索scaling law,设计模型架构(如Transformer、DiT)与预训练任务(MAE、动作预测、对比学习)。 基于VLM/VLA大模型构建自动标注管线,对视频、轨迹、触觉信号进行结构化标注(动作阶段、接触事件、成功/失败标签),降低人工成本。 设计主动学习策略,从海量数据中筛选高价值样本(失败轨迹、长尾场景)。 牵头制定数据混合策略:真机遥操作数据 : 无本体人类视频 : 仿真合成数据的最优比例,设计消融实验验证,建立数据价值评估模型。

任职要求

计算机视觉、机器人学、机器学习、图形学等相关专业硕士及以上学历,博士优先。 在以下至少一个方向有深入研究和项目经验: 三维重建/SLAM/3D Gaussian Splatting/物体姿态估计/人体手部重建 模仿学习(BC、ACT、Diffusion Policy)、强化学习(PPO、SAC)、机器人控制(MPC、力控)、VLA架构(RT-2、PaLM-E等) 多模态预训练(CLIP、LLaVA)、大模型微调(LoRA、RLHF)、自动标注、数据合成与数据策略 扎实的编程能力:精通Python,熟悉C++,熟练使用PyTorch/JAX等深度学习框架。 熟悉至少一种仿真器(Isaac Sim、Mujoco、PyBullet)或真实机器人平台。 具备优秀的学习能力、逻辑思维与跨团队协作精神,能够快速将前沿论文转化为可工作的原型。 加分项 有真实机器人(机械臂、人形、四足)部署经验,特别是高复杂度操作任务(装配、双手协作)。 在CVPR/ICCV/ECCV/CoRL/ICRA/RSS/NeurIPS等顶会发表论文,或有高质量开源贡献。 处理过Ego4D、HoloAssist或自采机器人混合数据,有Sim2Real迁移实战经验。 熟悉ROS/ROS2,有实时系统或嵌入式开发经验。

相关职位推荐