职位描述
聚焦灵巧手操作场景,参与具身智能模型与AI Agent的核心算法研发。你将与顶尖团队一起,构建从数据到模型、从训练到部署、从仿真到真机的完整闭环,在真实机器人上验证你的算法。
1. 数据工程与训练基础设施:
- 参与构建可规模化的数据生产流水线,接触真实机器人海量数据。
- 学习并参与大规模分布式训练系统优化。
- 动手实践模型推理优化与端侧部署,让算法真正跑在机器人上。
2. 预训练与后训练:
- 参与多模态数据配比与表示学习,探索VLA/具身大模型前沿。
- 挑战灵巧手操作任务的强化学习算法,从离线模仿学习到在线强化学习全链路
研究视觉、触觉、力反馈等多模态感知信息与决策的深度融合。
3. AI Agent与规划:
- 设计任务理解与分解机制,挑战长时序、多步骤灵巧操作的在线规划。
- 实现工作流的状态管理、异常处理与动态调整。
- 集成大语言模型及外部API,完成Agent在仿真与真机中的部署验证。
4. 评测体系与迭代:
- 搭建仿真与真机评测基准,定义“什么是好的灵巧手模型”。
- 主导模型失败案例分析,你的分析将直接驱动算法迭代。
- 跟踪具身智能与强化学习领域前沿技术,推动算法在真实灵巧手上持续进化。