职位描述
1、搭建VLA离线自动化评测链路,完成模型视觉、动作预测离线校验,降低真机评测损耗,用Benchmark量化零样本、长时序任务指标,输出评测结论驱动算法迭代优化
2、维护机器人场景库,开展真机端到端全链路评测,把控对外Demo交付质量,对交付风险拥有一票否决权
3、模型、执行全链路缺陷,联动uDAS数采、DAgger数据迭代闭环问题,自主开发评测脚本、维护Docker评测环境
4、独立制定评测准入、回归标准,直接跨团队对接算法、硬件协作,全程主导模块从方案到落地复盘
5、深耕具身机器人评测体系,补齐AI+机器人交叉工程能力,掌握行业前沿评测方法论