实习职位特点
总实习月数:2个月
周实习天数:5天
优选专业
职位描述
职位描述:
团队介绍:快手AI云原生架构团队负责快手训推一体的调度引擎,支撑可灵、搜推广等核心业务的GPU资源优化。
1、为快手打造大模型AI云原生K8s 基础设施建设,具备万卡以上规模的CPU/GPU调度能力,支撑包括 可灵大模型、搜推广 等核心模型的训练与推理调度;
2、支撑数据、训练、推理等全场景AI负载生命周期管理,构建训推一体的统一调度架构,落地统一的配额和算力管理机制,实现负载高效协同与资源精准管控;
3、深耕 GPU 调度与性能优化,落地 GPU 拓扑感知、优先级、抢占、QoS 感知等调度能力,支撑万卡级大规模 AI 任务高效运行;
4、聚焦大模型云原生基础设施建设,负责高性能网络与存储加速、多云部署与调度能力,解决大模型训推理在通信、调度上的关键挑战,持续推动云原生与 AI 技术深度融合与架构创新。
任职要求:
1、硕士及以上学历,计算机相关专业;
2、熟悉Golang/Java/Python至少一种编程语言,具备基础代码编写能力;
3、了解Kubernetes基本原理,对GPU优化、云原生领域有浓厚兴趣,愿意主动学习;
4、有算法模型研发/数据领域经验优先;
5、学习能力强,有责任心,具备良好的沟通协作能力和团队配合意识。
团队介绍:快手AI云原生架构团队负责快手训推一体的调度引擎,支撑可灵、搜推广等核心业务的GPU资源优化。
1、为快手打造大模型AI云原生K8s 基础设施建设,具备万卡以上规模的CPU/GPU调度能力,支撑包括 可灵大模型、搜推广 等核心模型的训练与推理调度;
2、支撑数据、训练、推理等全场景AI负载生命周期管理,构建训推一体的统一调度架构,落地统一的配额和算力管理机制,实现负载高效协同与资源精准管控;
3、深耕 GPU 调度与性能优化,落地 GPU 拓扑感知、优先级、抢占、QoS 感知等调度能力,支撑万卡级大规模 AI 任务高效运行;
4、聚焦大模型云原生基础设施建设,负责高性能网络与存储加速、多云部署与调度能力,解决大模型训推理在通信、调度上的关键挑战,持续推动云原生与 AI 技术深度融合与架构创新。
任职要求:
1、硕士及以上学历,计算机相关专业;
2、熟悉Golang/Java/Python至少一种编程语言,具备基础代码编写能力;
3、了解Kubernetes基本原理,对GPU优化、云原生领域有浓厚兴趣,愿意主动学习;
4、有算法模型研发/数据领域经验优先;
5、学习能力强,有责任心,具备良好的沟通协作能力和团队配合意识。
公司简介
快手是领先的内容社区和社交平台,是短视频行业开创者与引领者。快手致力于创造一个温暖和信任的社区,让更多普通人拥有表达和被看见的机会,并由此培育了繁荣与高互动的社区生态,每天有上千万优质内容上传。
VIP·学生版
会员8大特权,免费使用
职业测评
免费
新发岗推荐
免费
竞争力分析
免费
AI改简历
免费
简历模版
免费
AI模拟面试
免费
1V1 HR导师
免费
尊贵身份标识
免费
立即开通
智联安全提示
立即举报![]()
用人单位若存在以下违法行为,请您提高警惕,立刻报警或者向平台举报: 1.强迫或者要求您投资入股、购买虚拟货币(如比特币)、转账、汇款等 2.要求您提供担保人、担保金或者以其他名义向您收取财物 3.以招聘名义向您牟取任何不正当利益(财产权益、人身权益) 4.扣押您的身份证件或者其他证件 5.要求您添加微信、QQ进行转账、汇款 6.其他损害您合法权益的行为等



