任职要求
1、计算机科学、人工智能、模式识别等相关专业,硕士研究生及以上学历;
2、2年以上算法研发经验,其中至少1年大模型评测或模型优化相关实践经验;
技术栈:
1、精通Python编程,熟练使用PyTorch/TensorFlow等深度学习框架,具备大规模模型训练/推理的工程化经验;
2、深入理解强化学习核心算法(如PPO、DPO、RLHF)与模型微调技术(如LoRA、QLoRA、Prefix Tuning),有实际落地案例(如通过RLHF优化模型对齐人类偏好);
3、熟悉大模型评测主流方法(如自动指标BLEU/ROUGE/BERTScore、人类评估流程、对抗评测),掌握评测指标设计逻辑与局限性分析;
加分项:有评委模型(Judge Model)相关研究或实践经验(如设计用于评估对话质量的分类/生成式裁判模型、优化裁判模型的一致性/可靠性);主导或参与过顶会论文(如ACL、EMNLP、NeurIPS)发表,或在Kaggle、GLUE/SuperGLUE等权威评测中取得Top成绩。