实习职位特点
总实习月数:4个月
周实习天数:4天
其他说明:可转正
职位描述
职位描述:1、负责智能体核心能力的研发与工程化:提升语言模型和多模态模型在多轮交互、Function Calling、结合Agent框架的决策与推理等场景的稳定性与泛化能力;
2、参与 SFT 与 Agentic RL 的数据设计与构建:参与智能体任务的数据设计、生成与清洗流程,构建高质量用于SFT与RL的Function Calling训练数据;
3、参与模型训练与调优:参与大模型的SFT、Agentic RL等训练流程,优化模型在多轮对话、工具调用、决策推理任务中的表现;
4、Agent系统协同开发:构建基于大模型的Agent平台原型,支持模型推理以及工具调用等功能;
5、评测体系设计与分析:设计Agent能力相关的评测任务和指标,追踪训练效果,驱动训练闭环优化;
职位要求:1、熟悉大模型训练与微调流程:具有LLM或多模态模型训练经验,熟悉SFT、RLHF等方法;
2、Agent相关实践:了解或参与过智能体系统构建,包括任务规划、函数调用等功能模块的设计与实现;
3、强化学习基础:熟悉RL基础知识以及RL在大模型微调中的应用,特别是LLM reasoning, Agentic RL等场景下的训练,熟悉verl等训练框架优先;
4、工程实现能力:熟练使用Python,熟悉PyTorch等主流深度学习框架,具备扎实的代码能力;
5、线下实习优先,每周出勤天数≥4天,能实习6个月及以上优先。
【加分项】
参与开发过有影响力的开源智能体项目(如基于LangChain、LangGraph等的项目);
在主流agent类benchmark上有开源贡献,或在ACM/ICPC,Kaggle等竞赛中取得过优异成绩优先;
在顶级会议/期刊(NeurlPS,ICML,ICLR,ACL,EMNLP等)以一作或主要贡献者身份发表论文优先;
具备数据构建、自动标注、数据质量验证的实战经验;
2、参与 SFT 与 Agentic RL 的数据设计与构建:参与智能体任务的数据设计、生成与清洗流程,构建高质量用于SFT与RL的Function Calling训练数据;
3、参与模型训练与调优:参与大模型的SFT、Agentic RL等训练流程,优化模型在多轮对话、工具调用、决策推理任务中的表现;
4、Agent系统协同开发:构建基于大模型的Agent平台原型,支持模型推理以及工具调用等功能;
5、评测体系设计与分析:设计Agent能力相关的评测任务和指标,追踪训练效果,驱动训练闭环优化;
职位要求:1、熟悉大模型训练与微调流程:具有LLM或多模态模型训练经验,熟悉SFT、RLHF等方法;
2、Agent相关实践:了解或参与过智能体系统构建,包括任务规划、函数调用等功能模块的设计与实现;
3、强化学习基础:熟悉RL基础知识以及RL在大模型微调中的应用,特别是LLM reasoning, Agentic RL等场景下的训练,熟悉verl等训练框架优先;
4、工程实现能力:熟练使用Python,熟悉PyTorch等主流深度学习框架,具备扎实的代码能力;
5、线下实习优先,每周出勤天数≥4天,能实习6个月及以上优先。
【加分项】
参与开发过有影响力的开源智能体项目(如基于LangChain、LangGraph等的项目);
在主流agent类benchmark上有开源贡献,或在ACM/ICPC,Kaggle等竞赛中取得过优异成绩优先;
在顶级会议/期刊(NeurlPS,ICML,ICLR,ACL,EMNLP等)以一作或主要贡献者身份发表论文优先;
具备数据构建、自动标注、数据质量验证的实战经验;
公司简介
上海人工智能实验室,作为国际级人工智能新型研究机构,与全球理想主义者并肩前行,共探智能科学的未来。
VIP·学生版
会员8大特权,免费使用
职业测评
免费
新发岗推荐
免费
竞争力分析
免费
AI改简历
免费
简历模版
免费
AI模拟面试
免费
1V1 HR导师
免费
尊贵身份标识
免费
立即开通
智联安全提示
立即举报![]()
用人单位若存在以下违法行为,请您提高警惕,立刻报警或者向平台举报: 1.强迫或者要求您投资入股、购买虚拟货币(如比特币)、转账、汇款等 2.要求您提供担保人、担保金或者以其他名义向您收取财物 3.以招聘名义向您牟取任何不正当利益(财产权益、人身权益) 4.扣押您的身份证件或者其他证件 5.要求您添加微信、QQ进行转账、汇款 6.其他损害您合法权益的行为等



