上

【27届留用实习生】-安全可信智能体-安全可信AI中心

上海人工智能实验室| 上海· 龙文路129号（国际传媒港L1大楼）

实习博士

发布于 2026-04-22

职位描述

上海人工智能实验室安全团队专注于研究大模型和智能体的可信和安全，致力于从理解和提升角度推动人工智能向善发展。如果你对可信推理、安全攻防、对齐、可解释性等技术充满热情，或是对人工智能未来的涌现能力和潜在风险抱有深切的责任感，欢迎加入大模型安全团队。团队研究成果显著，多篇研究成果发表在顶级会议上，如CVPR Best Paper Award Candidate, 连续两年ACL Outstanding Paper Award, ICLR Oral和多篇ACL Oral等。 1. 核心参与深入研究大模型和人类价值观对齐的问题，包括内对齐、外对齐、自对齐等，和团队合作开发RLHF, GRPO等强化学习技术，以及对前沿强化学习路线研究。 2. 负责AI 智能体全链路安全研究，覆盖终端智能体、电脑操作智能体、具身智能体等复杂交互场景。构建智能体安全评测体系，设计评测基准、风险数据集与自动化评测工具，支撑智能体安全能力量化评估。 3. 开展智能体轨迹级安全监控与细粒度风险诊断，定位风险来源、失效模式与危害后果，实现可解释风险溯源。 4. 研究智能体安全对齐技术，包括Agentic SFT和RL，研发安全护栏、防御机制与对齐优化方法。

任职要求

1. 本科及以上学历，博士学历优先，计算机科学、电子信息、自动化或机器人相关专业背景优先，一年及以上工作经验者优先； 2. 具备扎实的机器学习和深度学习基础知识和算法实践能力，了解大模型的设计和训练流程； 3. 有大模型安全、智能体安全、对齐、可解释 AI、安全攻防相关研究 / 项目经验者优先。 4 熟悉常用的深度学习框架和工具，具备良好的编程能力，熟练使用Python、C/C++等编程语言； 5. 在CVPR、NeurIPS、ICLR等人工智能会议有出色发表记录者优先。加分项： 1. 在信息学奥赛、ACM 中获奖； 2. 具备安全护栏、风险评测、轨迹诊断、提示注入（Prompt Injection）防御等项目经验。 3. 参与过开源大模型 / 智能体安全相关项目开发。

【实习】基座模型算法（生命科学方向）-AI For Science中心

2026-06-24

上海人工智能实验室· 上海·

26届

岗位详情

加入投递

【实习】AI for 前沿科学实习生（物质科学方向）-数据平台中心

2026-06-22

上海人工智能实验室· 上海·

26届

岗位详情

加入投递

【实习】多模态地球观测基础模型科研实习生-AI For Science中心

2026-06-22

上海人工智能实验室· 上海·

26届

岗位详情

加入投递

NOBO诺博橡胶-项目专员1199

2026-06-25

长城汽车· 保定市-徐水区·

26届

岗位详情

加入投递

泰州分公司-储备干部5401

2026-06-01

长城汽车· 泰州市-高港区·

26届

岗位详情

加入投递

诺博汽车-平湖工厂-车间技术岗

2026-05-21

长城汽车· 嘉兴市-平湖市·

26届

岗位详情

加入投递

【27届留用实习生】-安全可信智能体-安全可信AI中心

职位描述

任职要求

相关职位推荐

【实习】基座模型算法（生命科学方向）-AI For Science中心

【实习】AI for 前沿科学实习生（物质科学方向）-数据平台中心

【实习】多模态地球观测基础模型科研实习生-AI For Science中心

NOBO诺博橡胶-项目专员1199

泰州分公司-储备干部5401

诺博汽车-平湖工厂-车间技术岗