职位描述
1. 具身操作数据全链路管线搭建:主导设计并落地覆盖具身智能场景的端到端数据处理管线,涵盖任务定义、数据采集、清洗、标注、时序对齐、格式化、存储与分发全流程。
2. 具身任务体系与标注标准定义:设计标准化的具身操作任务范式,完成复杂长程行为 / 操作任务的层级拆解,构建动作序列标注规范。
3. 全流程数据质量管控体系建设:搭建数据生产全周期的质量管控体系,制定数据生产过程中的实时监督机制、多维度质检标准与交付验收流程;开发自动化质检工具与校验规则引擎,实现对数据完整性、时序一致性、标注准确率、场景合规性、动作有效性的全维度监控与异常拦截。
4. 具身数据评测体系与数据洞察:构建系统化的具身数据评测体系,设计覆盖分布均衡性、场景覆盖率、维度有效性、价值密度、长尾适配性的多维度数据评估指标。
5. 数据生产流程与工具链优化:持续迭代数据生产流程,设计并优化 Prompt 工程、半自动 / 自动化标注方案,解决数据生产过程中的效率与质量瓶颈,规模化提升数据生产效率。