大模型数据平台研发工程师

自变量机器人科技(深圳)有限公司| 深圳/北京
校招大数据本科
发布于 2026-06-24

职位描述

岗位定位 负责机器人/多模态数据湖仓与高并发数据闭环平台建设,支撑数据入湖、解析治理、任务调度、结果回流和训练数据消费。 岗位职责 1、建设多模态数据湖仓能力,包括数据接入、元数据管理、湖表建模、版本血缘、权限控制和训练集 Manifest。 2、负责机器人多源数据解析与标准化,支持 rosbag、视频、图像、JSON、点云、传感器日志等数据,并适配多机器人型号和硬件平台差异。 3、建设高并发数据平台后端与任务系统,支持任务提交、状态流转、幂等控制、异步调度、失败重试、限流、回调和可观测性。 4、建设大规模数据处理 pipeline,支撑质检、清洗、标注、Caption、特征抽取、数据回流和训练数据构建。 5、依托 AI Coding 工具完成平台前端、数据看板、管理后台和运维工具开发,具备端到端全栈交付能力。

任职要求

职位要求 1、本科及以上,计算机、软件工程、机器人、自动化等相关专业,计算机基础扎实。 2、熟练 Python 或 Go,具备高并发服务、并发编程、异步任务、工程化开发和测试经验;Python/Go 双栈优先。 3、熟悉 Linux、Shell、网络、IO、进程/线程,具备线上排查、性能分析和资源优化能力。 4、熟悉 ROS/ROS2 和 rosbag,具备机器人多源数据解析、转换、同步或性能优化经验。 5、熟悉数据湖仓或大数据技术,如 Iceberg/Paimon/Hudi、Spark/Flink、Trino/ClickHouse 等。 6、熟悉数据库、对象存储、消息队列或任务调度系统,如 PostgreSQL/MySQL、OSS/S3、Kafka、Ray、Prefect 等。 7、具备 AI 辅助全栈开发能力,能快速交付内部平台、数据看板和可视化工具;熟悉 Docker、Kubernetes、CI/CD 优先。 8、具备 Ownership,能独立完成需求分析、方案设计、开发落地、测试验证和问题复盘。 加分项 1、有大规模机器人、自动驾驶、具身智能或多模态数据平台经验。 2、熟悉多机器人型号适配、传感器标准化、时间同步、标定管理。 3、有训练集构建、数据血缘/版本管理、湖仓优化或大规模数据回刷经验。

相关职位推荐