职位描述
1、负责全模态世界模型的架构设计、训练方法与算法迭代,探索语言、视觉、视频、动作、触觉等模态的统一建模。
2、推进世界模型在物理场景理解、未来状态预测、动作生成、交互结果模拟、机器人策略学习等方向的技术攻关。
3、面向从双臂系统、轮式人形到全尺寸人形机器人等多种机器人形态,并进一步探索灵巧手等高自由度系统,构建统一的动作表示与数据体系。
4、参与机器人多模态数据的采集、清洗、训练、评测与闭环迭代,推动模型在真实机器人任务中的验证与落地。
5、持续跟踪多模态大模型、视频生成、具身智能、world model、robot learning 等前沿方向,形成技术预研、论文和核心技术壁垒。