实习职位特点
总实习月数:4个月
周实习天数:4天
其他说明:可转正
职位描述
职位描述:上海人工智能实验室安全团队专注于研究大模型和智能体的可信和安全,致力于从理解和提升角度推动人工智能向善发展。如果你对可信推理、安全攻防、对齐、可解释性等技术充满热情,或是对人工智能未来的涌现能力和潜在风险抱有深切的责任感,欢迎加入大模型安全团队。团队研究成果显著,多篇研究成果发表在顶级会议上,如CVPR Best Paper Award Candidate, 连续两年ACL Outstanding Paper Award, ICLR Oral和多篇ACL Oral等。
1. 核心参与深入研究大模型和人类价值观对齐的问题,包括内对齐、外对齐、自对齐等,和团队合作开发RLHF, GRPO等强化学习技术,以及对前沿强化学习路线研究。
2. 负责AI 智能体全链路安全研究,覆盖终端智能体、电脑操作智能体、具身智能体等复杂交互场景。构建智能体安全评测体系,设计评测基准、风险数据集与自动化评测工具,支撑智能体安全能力量化评估。
3. 开展智能体轨迹级安全监控与细粒度风险诊断,定位风险来源、失效模式与危害后果,实现可解释风险溯源。
4. 研究智能体安全对齐技术,包括Agentic SFT和RL,研发安全护栏、防御机制与对齐优化方法。
职位要求:1. 本科及以上学历,博士学历优先,计算机科学、电子信息、自动化或机器人相关专业背景优先,一年及以上工作经验者优先;
2. 具备扎实的机器学习和深度学习基础知识和算法实践能力,了解大模型的设计和训练流程;
3. 有大模型安全、智能体安全、对齐、可解释 AI、安全攻防相关研究 / 项目经验者优先。
4 熟悉常用的深度学习框架和工具,具备良好的编程能力,熟练使用Python、C/C++等编程语言;
5. 在CVPR、NeurIPS、ICLR等人工智能会议有出色发表记录者优先。
加分项:
1. 在信息学奥赛、ACM 中获奖;
2. 具备安全护栏、风险评测、轨迹诊断、提示注入(Prompt Injection)防御等项目经验。
3. 参与过开源大模型 / 智能体安全相关项目开发。
1. 核心参与深入研究大模型和人类价值观对齐的问题,包括内对齐、外对齐、自对齐等,和团队合作开发RLHF, GRPO等强化学习技术,以及对前沿强化学习路线研究。
2. 负责AI 智能体全链路安全研究,覆盖终端智能体、电脑操作智能体、具身智能体等复杂交互场景。构建智能体安全评测体系,设计评测基准、风险数据集与自动化评测工具,支撑智能体安全能力量化评估。
3. 开展智能体轨迹级安全监控与细粒度风险诊断,定位风险来源、失效模式与危害后果,实现可解释风险溯源。
4. 研究智能体安全对齐技术,包括Agentic SFT和RL,研发安全护栏、防御机制与对齐优化方法。
职位要求:1. 本科及以上学历,博士学历优先,计算机科学、电子信息、自动化或机器人相关专业背景优先,一年及以上工作经验者优先;
2. 具备扎实的机器学习和深度学习基础知识和算法实践能力,了解大模型的设计和训练流程;
3. 有大模型安全、智能体安全、对齐、可解释 AI、安全攻防相关研究 / 项目经验者优先。
4 熟悉常用的深度学习框架和工具,具备良好的编程能力,熟练使用Python、C/C++等编程语言;
5. 在CVPR、NeurIPS、ICLR等人工智能会议有出色发表记录者优先。
加分项:
1. 在信息学奥赛、ACM 中获奖;
2. 具备安全护栏、风险评测、轨迹诊断、提示注入(Prompt Injection)防御等项目经验。
3. 参与过开源大模型 / 智能体安全相关项目开发。
公司简介
上海人工智能实验室,作为国际级人工智能新型研究机构,与全球理想主义者并肩前行,共探智能科学的未来。
VIP·学生版
会员8大特权,免费使用
职业测评
免费
新发岗推荐
免费
竞争力分析
免费
AI改简历
免费
简历模版
免费
AI模拟面试
免费
1V1 HR导师
免费
尊贵身份标识
免费
立即开通
智联安全提示
立即举报![]()
用人单位若存在以下违法行为,请您提高警惕,立刻报警或者向平台举报: 1.强迫或者要求您投资入股、购买虚拟货币(如比特币)、转账、汇款等 2.要求您提供担保人、担保金或者以其他名义向您收取财物 3.以招聘名义向您牟取任何不正当利益(财产权益、人身权益) 4.扣押您的身份证件或者其他证件 5.要求您添加微信、QQ进行转账、汇款 6.其他损害您合法权益的行为等



