上

【27届留用实习生】-大模型评测算法-评测与标准中心

上海人工智能实验室| 上海· 龙文路129号（国际传媒港L1大楼）

实习硕士

发布于 2026-04-21

职位描述

1、负责构建大模型与 Agent 的评测体系与评测平台 2、设计 Agent / LLM Benchmark、任务环境与评测指标 3、研发自动化评测策略，包括 LLM-as-a-judge、execution-based evaluation 等 4、分析 Agent trajectory 与任务执行过程，评估任务成功率与失败模式 5、支持模型对比分析与排行榜（Leaderboard）建设，推动评测体系持续演进

任职要求

1、计算机、人工智能或相关专业硕士及以上学历 2、扎实的算法基础与工程能力，熟练使用 Python 3、熟悉大模型或 Agent 技术生态（LLM、Tool Use、Agent Framework 等） 4、对模型评测、Benchmark 构建或自动化评测系统有兴趣或相关经验加分项： 1、参与过 LLM evaluation、benchmark 或评测平台相关项目 2、熟悉常见评测体系或平台，如 HumanEval、SWE-bench、WebArena、Chatbot Arena 等

【实习】基座模型算法（生命科学方向）-AI For Science中心

2026-06-24

上海人工智能实验室· 上海·

26届

岗位详情

加入投递

【实习】AI for 前沿科学实习生（物质科学方向）-数据平台中心

2026-06-22

上海人工智能实验室· 上海·

26届

岗位详情

加入投递

【实习】多模态地球观测基础模型科研实习生-AI For Science中心

2026-06-22

上海人工智能实验室· 上海·

26届

岗位详情

加入投递

NOBO诺博橡胶-项目专员1199

2026-06-25

长城汽车· 保定市-徐水区·

26届

岗位详情

加入投递

泰州分公司-储备干部5401

2026-06-01

长城汽车· 泰州市-高港区·

26届

岗位详情

加入投递

诺博汽车-平湖工厂-车间技术岗

2026-05-21

长城汽车· 嘉兴市-平湖市·

26届

岗位详情

加入投递

【27届留用实习生】-大模型评测算法-评测与标准中心

职位描述

任职要求

相关职位推荐

【实习】基座模型算法（生命科学方向）-AI For Science中心

【实习】AI for 前沿科学实习生（物质科学方向）-数据平台中心

【实习】多模态地球观测基础模型科研实习生-AI For Science中心

NOBO诺博橡胶-项目专员1199

泰州分公司-储备干部5401

诺博汽车-平湖工厂-车间技术岗