职位描述
1. 负责具身智能统一预训练框架的设计与迭代,支撑 VLA、大模型、世界模型、大小脑等多种模型架构的高效训练。
2. 深入理解 VLA、多模态大模型、世界模型、视频生成等前沿算法,基于算法特性设计框架层面的训练策略与优化方案。
3. 设计并实现多模态数据加载体系,支持图片、视频、点云、触觉等多种数据格式的高效接入与预处理。
4. 设计并实现多种分布式并行策略(数据并行、模型并行、流水线并行、混合并行等),适配从百亿到千亿级参数模型的训练需求。
5. 构建数据全生命周期闭环能力,包括数据版本管理、质量筛选、配比策略,打通从数据采集到模型训练的完整链路。
6. 跟进预训练领域前沿进展,具备快速复现并工程化落地新算法的能力。