世界模型算法实习生(视频生成方向)

北京初速度科技有限公司| 北京/上海/苏州/深圳
实习研发博士
发布于 2026-03-24

职位描述

1、主导研发具备时空一致性的端到端智驾大模型(World Model),聚焦视频生成相关技术落地,支撑环境建模、未来预测与策略评估等核心任务; 2、结合Diffusion/自回归等生成式模型,提升真实交通场景下的多模态预测、不确定性建模精度与鲁棒性; 3、泛化端到端模型性能,重点解决在长时序、复杂交互场景中的时空连贯性问题,保障模型的稳定性与泛化能力; 4、负责端到端模型在L4无人物流场景的规模化落地,推动技术从研发到实际应用的转化。

任职要求

1、计算机科学/人工智能/机器人/自动化等相关专业硕士及以上学历,博士优先; 2、在自动驾驶/机器人等对时空一致性要求较高的任务中有实际应用经验者优先; 3、有Diffusion Model/自回归时序模型或世界模型相关研究与实践经验优先; 4、扎实的编程能力,熟练使用 Python/C++,具备良好的数据结构与算法基础; 5、熟悉主流深度学习框架(PyTorch等),并对模型训练、优化与工程实现有深入理解; 6、有Generative Model/World Model/Diffusion Model/VLM等相关经验,熟悉Stable Diffusion/MagicDrive/Emu/OpenSora等相关算法和框架库的优先。 加分项 有ACM-ICPC/RoboMaster/RoboCup 等编程比赛获奖经历的优先; 在CVPR/ICCV/ECCV/NeurIPS/ICLR/ICML等顶会或期刊发表过论文者优先。

相关职位推荐