优选专业
职位描述
岗位职责:
1. 负责开发和优化大模型训练系统,使用混合并行、自动并行和通信优化等技术,提高内部模型训练的速度和效率;
2. 设计并实现高效的大模型训练工具,紧跟模型架构的演进,不断优化并行训练策略,以满足公司业务发展的需求;
3. 深入进行大模型训练的性能分析,精准识别并解决训练过程中的性能瓶颈,确保训练效率最大化,充分挖掘硬件资源的潜力。
任职要求:
1. 拥有计算机科学或相关领域博士学位,对分布式系统、机器学习系统有深入的理解和实践经验;
2. 熟悉至少一种编程语言,熟悉PyTorch FSDP、DeepSpeed或Megatron-LM等任一分布式训练框架,优先考虑有大规模预训练模系统优化经验的候选人。
3. 良好的数据分析和问题解决能力,良好的业务理解能力。
4. 优先考虑在计算机系统领域的顶级会议和期刊发表过发表过论文的候选人。
1. 负责开发和优化大模型训练系统,使用混合并行、自动并行和通信优化等技术,提高内部模型训练的速度和效率;
2. 设计并实现高效的大模型训练工具,紧跟模型架构的演进,不断优化并行训练策略,以满足公司业务发展的需求;
3. 深入进行大模型训练的性能分析,精准识别并解决训练过程中的性能瓶颈,确保训练效率最大化,充分挖掘硬件资源的潜力。
任职要求:
1. 拥有计算机科学或相关领域博士学位,对分布式系统、机器学习系统有深入的理解和实践经验;
2. 熟悉至少一种编程语言,熟悉PyTorch FSDP、DeepSpeed或Megatron-LM等任一分布式训练框架,优先考虑有大规模预训练模系统优化经验的候选人。
3. 良好的数据分析和问题解决能力,良好的业务理解能力。
4. 优先考虑在计算机系统领域的顶级会议和期刊发表过发表过论文的候选人。
公司简介
上海人工智能实验室,作为国际级人工智能新型研究机构,与全球理想主义者并肩前行,共探智能科学的未来。
VIP·学生版
会员5大特权,免费使用
竞争力分析
免费
AI改简历
免费
简历模版
免费
职业测评
免费
尊贵身份标识
免费
立即开通
智联安全提示
立即举报![]()
用人单位若存在以下违法行为,请您提高警惕,立刻报警或者向平台举报: 1.强迫或者要求您投资入股、购买虚拟货币(如比特币)、转账、汇款等 2.要求您提供担保人、担保金或者以其他名义向您收取财物 3.以招聘名义向您牟取任何不正当利益(财产权益、人身权益) 4.扣押您的身份证件或者其他证件 5.要求您添加微信、QQ进行转账、汇款 6.其他损害您合法权益的行为等



