实习职位特点
总实习月数:2个月
周实习天数:4天
其他说明:可转正
优选专业
职位描述
职位描述
1. 负责分布式大语言模型 (LLM) 推理系统的底层基础设施研究与探索,包括 GPU 和 RDMA 等,提升 GPU 环境下的稳定性和计算效率;
2. 负责大规模模型训练场景优化工作,通过建设全面的异常发现、故障自愈机制,提升平台训练 MFU,降低训练成本;
3. 基于容器以及 Kubernetes 技术,负责对机器学习领域中的资源调度、模型训练、模型推理、数据管理等多个子方向的成本效率优化工作;
4. 持续关注并跟进业界技术发展,比如超长上下文、思维链、多模态方向;
任职要求
1. 本科及以上学历,计算机相关专业;
2. 掌握常用数据结构与算法,具备扎实的编程基础和良好的编码习惯;
3. 熟悉至少一种编程语言(如 Golang、Java、Python 等);
4. 有 Docker、Kubernetes、vLLM、SGLang、RouteLLM 等技术的学习或实践经验者优先,参与过开源项目更佳;
5. 积极主动,自驱力强,具备良好的团队合作精神和解决问题的能力;
6. 对如下一个或多个领域有浓厚的兴趣,并愿意付出自己的时间进行深入研究和探索:
a. 机器学习框架:PyTorch、TensorFlow等机器学习框架、GPU等异构计算芯片及优化、MLOps、CV/NLP/搜广推等领域模型算法等;
b. 云原生:Kubernetes及容器系统、大规模训练任务和推理服务编排和调度、镜像加速等;
1. 负责分布式大语言模型 (LLM) 推理系统的底层基础设施研究与探索,包括 GPU 和 RDMA 等,提升 GPU 环境下的稳定性和计算效率;
2. 负责大规模模型训练场景优化工作,通过建设全面的异常发现、故障自愈机制,提升平台训练 MFU,降低训练成本;
3. 基于容器以及 Kubernetes 技术,负责对机器学习领域中的资源调度、模型训练、模型推理、数据管理等多个子方向的成本效率优化工作;
4. 持续关注并跟进业界技术发展,比如超长上下文、思维链、多模态方向;
任职要求
1. 本科及以上学历,计算机相关专业;
2. 掌握常用数据结构与算法,具备扎实的编程基础和良好的编码习惯;
3. 熟悉至少一种编程语言(如 Golang、Java、Python 等);
4. 有 Docker、Kubernetes、vLLM、SGLang、RouteLLM 等技术的学习或实践经验者优先,参与过开源项目更佳;
5. 积极主动,自驱力强,具备良好的团队合作精神和解决问题的能力;
6. 对如下一个或多个领域有浓厚的兴趣,并愿意付出自己的时间进行深入研究和探索:
a. 机器学习框架:PyTorch、TensorFlow等机器学习框架、GPU等异构计算芯片及优化、MLOps、CV/NLP/搜广推等领域模型算法等;
b. 云原生:Kubernetes及容器系统、大规模训练任务和推理服务编排和调度、镜像加速等;
工作地点

快手网络科技有限公司
公司简介
快手是领先的内容社区和社交平台,是短视频行业开创者与引领者。快手致力于创造一个温暖和信任的社区,让更多普通人拥有表达和被看见的机会,并由此培育了繁荣与高互动的社区生态,每天有上千万优质内容上传。
VIP·学生版
会员6大特权,免费使用

简历置顶
免费

简历模版
免费

职业测评
免费

简历刷新
自动刷新

体验课程
免费

尊贵身份标识
免费
立即开通

智联安全提示
立即举报
用人单位若存在以下违法行为,请您提高警惕,立刻报警或者向平台举报: 1.强迫或者要求您投资入股、购买虚拟货币(如比特币)、转账、汇款等 2.要求您提供担保人、担保金或者以其他名义向您收取财物 3.以招聘名义向您牟取任何不正当利益(财产权益、人身权益) 4.扣押您的身份证件或者其他证件 5.要求您添加微信、QQ进行转账、汇款 6.其他损害您合法权益的行为等