任职要求
职位要求
1.计算机科学、数学、统计学或相关专业,数理基础扎实者优先。
2.熟悉大模型训练流程,具有模型训练经验,熟悉SFT、RL等方法与swift,verl,slime等模型训练框架。另外,了解FSDP,Megatron等技术背景者优先。
3.熟练使用Python,熟悉PyTorch等主流深度学习框架,具备扎实的代码能力。
4.能实习6个月及以上优先。
加分项
1.在顶级会议/期刊(NeurlPS,ICML,ICLR,ACL,EMNLP等)以一作或主要贡献者身份发表论文。
2.参与开发有影响力的开源项目优先。
具备模型基础架构(AI infra),具备模型算子优化(CUDA,triton)开发经验者优先。
3.熟悉swift,verl,slime等模型训练框架、了解FSDP,Megatron等技术背景者优先。