任职要求
1. 精通数据清洗全流程技术(异常检测/数据对齐/特征工程),熟悉Pandas/Spark等数据处理框架
2. 掌握Python/C++编程,精通PyTorch/TensorFlow数据处理模块,熟悉ROS等机器人开发工具
3. 熟悉多模态数据标注方法(文本/点云/时序传感数据),有3D标注、时序标注等复杂场景经验
4. 具备TB级数据处理经验,熟悉分布式计算框架,有机器人领域数据治理项目经历
加分项:
1. 在ICML/CVPR等顶会发表过数据质量相关论文,或参与过开源数据集建设
2. 主导开发过智能标注系统,在标注效率提升方面有显著成果
3. 熟悉仿真数据生成技术(Isaac Sim、Mujoco),具备虚实数据融合增强经验
4. 有自动驾驶数据闭环项目经验,熟悉点云标注、场景重建等复杂数据处理