任职要求
1. 计算机、人工智能、数学等相关专业硕士及以上学历
2. 熟悉Python、PyTorch,了解Transformer架构原理和主流开源LLM(Qwen、LLaMA、InternLM等)
3. 具备以下任一方向的经验或兴趣(可根据背景侧重):
- 预训练方向:了解分布式训练(DP/TP/PP)、熟悉Megatron-LM/DeepSpeed、有预训练或CPT经验
- 后训练方向:了解SFT/RLHF/DPO技术原理、熟悉强化学习基础(PPO等)、有微调或对齐经验
4. 具备良好的实验设计与问题分析能力,能够独立完成训练实验的设计、执行与复盘
5. 有大模型相关论文发表、开源项目贡献或竞赛获奖经历者优先
6. 实习时间要求:每周4天以上,持续6个月以上优先