【27届留用实习生】-大语言模型前沿风险-安全可信AI中心

上海人工智能实验室| 上海
实习硕士
发布于 2026-04-22

职位描述

负责大语言模型及多智能体系统前沿AI风险管理与安全治理核心研究,聚焦模型全生命周期内生风险、外部抵御风险及CBRN专项智能安全防控方向。通过技术创新搭建标准化风控体系,提升前沿模型部署合规性与抗风险能力,推动前沿AI风险治理与跨领域应急防控方案落地应用。 1. 主攻大模型与智能体风险建模、量化识别及可信治理研究,重点攻坚模型对齐失效、数据污染、心智诱导滥用、CBRN智能衍生安全风险等关键课题,构建全维度动态风险研判与感知体系。 2. 研发创新型前沿 AI风险防控策略与核心算法,涵盖风险感知提示工程、高危数据净化、CBRN场景风险隔离与应急阻断技术,实现风险事前预判、事中管控、事后溯源的全闭环治理。 3. 持续跟进全球AI风控、CBRN智能安全、IEC国际安全标准及前沿框架研究进展,参与行业学术研讨、技术攻坚及跨机构风控协同工作。

任职要求

硕士及以上学历,计算机、人工智能、网络空间安全及AI安全交叉相关专业; - 精通大语言模型Transformer架构及预训练、微调、对齐全流程技术,具备扎实Python编程功底; - 深耕大模型安全可信、CBRN智能防控、AI治理交叉领域,具备优秀风险研判、逻辑推演与实验复盘能力; - 熟练阅读英文专业文献,可快速跟进全球前沿AI安全技术与国际标准动态。 专业经验(满足一项及以上即可) - 有AI安全、网络攻防、生物安全、风险量化相关科研经历,熟悉大模型安全评测与实验范式; - 具备大模型安全攻防、多智能体风险模拟、AI安全治理搭建或CBRN风险研判项目实操经验; - 有大模型对齐微调、复杂风险推理、高危场景管控及合规约束算法研发落地经验。 加分项 - 在NeurIPS、ICML、ACL、CCS、USENIX Security等顶会/期刊发表大模型安全相关论文; - 具备跨学科研究能力,可将CBRN风控与AI治理理论转化为可计算、可落地的算法模型; - 参与过IEC/ITU AI安全国际标准、行业安全规范编制或CBRN智能风控专项项目。

相关职位推荐