任职要求
1、计算机、人工智能或相关专业硕士及以上学历
2、扎实的算法基础与工程能力,熟练使用 Python
3、熟悉大模型或 Agent 技术生态(LLM、Tool Use、Agent Framework 等)
4、对模型评测、Benchmark 构建或自动化评测系统有兴趣或相关经验
加分项:
1、参与过 LLM evaluation、benchmark 或评测平台相关项目
2、熟悉常见评测体系或平台,如 HumanEval、SWE-bench、WebArena、Chatbot Arena 等