优才-具身智能算法工程师(训练效率方向)-觅蜂子公司

智元创新(上海)科技股份有限公司| 上海
校招硕士
发布于 2026-06-16

职位描述

1. 负责具身智能训练效率的度量、分析与系统性优化,覆盖预训练与后训练全链路。 2. 深入理解不同模型架构(Transformer / Diffusion / Flow Matching 等)与训练算法(IL/RL/BC 等)的计算特性,针对性设计优化方案。 3. 构建训练效率监控体系,包括 GPU 利用率、训练吞吐、通信效率、数据加载延迟等核心指标的可视化与自动化追踪。 4. 模型训练效率优化:算子融合、CUDA graph、kernel 调优等,提升单卡和多卡计算效率。 5. 并行与通信效率优化:梯度同步、云边通信、权重分发等通信开销分析与优化,支撑百台规模训练不退化。 6. 数据加载效率优化:数据预处理 pipeline、IO 吞吐优化,消除数据侧瓶颈。

任职要求

1. 计算机、AI 等相关专业硕士及以上学历。 2. 具备扎实的 Python/C++/CUDA 编程能力,有 GPU kernel 开发或性能调优经验。 3. 对深度学习模型架构与训练算法有扎实理解,能基于算法计算特性定位瓶颈并设计优化方案。 4. 熟练掌握性能分析工具(Nsight Systems / PyTorch Profiler / NVIDIA Profiler 等),能系统性定位训练瓶颈。 5. 熟悉分布式通信机制(NCCL / MPI / gRPC 等),理解通信拓扑、带宽、延迟对训练效率的影响。 6. 对训练全链路(数据加载 → 前向 → 反向 → 梯度同步 → 参数更新)有整体理解,能从算法和系统两个视角做联合优化。

相关职位推荐