【27届留用实习生】-智能体可信诊断算法-安全可信AI中心

上海人工智能实验室| 上海
实习本科
发布于 2026-04-22

职位描述

1. 参与智能体的风险评估与能力定义,对已有的各种Agent环境进行适配; 2. 参与智能体安全评测相关工作: 构建数据测试智能体的安全性能,分析新一代AI的潜在安全风险边界,设计评测体系; 3. 参与解决智能体安全对齐的问题,包括内对齐、外对齐等,和团队合作开发RLVR等强化学习技术,以及对前沿强化学习路线研究,通过训练或推理时对齐提升智能体安全; 4. 参与智能体环境搭建相关工作:根据需要的Agent环境,如电脑、手机、网络环境等,使用docker进行环境搭建。

任职要求

1. 本科及以上学历,计算机科学、电子信息、信息安全或相关专业背景优先; 2. 具备扎实的机器学习和深度学习基础知识和算法实践能力,了解Agent的设计和训练流程,熟练使用docker; 3. ACM等编程竞赛获奖者,熟悉大模型相关研究的前沿进展,有顶会论文(如NeurIPS, CVPR, CCS等)优先; 4. 扎实的编程基础,对数据结构、算法设计基础有深度了解,熟练掌握Python/C++等主流语言一种或多种; 5. 熟悉SFT、RLHF、GRPO等后训练方法和框架,能基于实际业务问题,设计合理、高效训练流程; 6. 有安全领域相关评测或对齐经验优先。

相关职位推荐