优选专业
职位描述
职位描述:
1、参与大模型推理/训练优化。通过研发业界领先的AI Compiler 技术,支撑搜推场景在GPU上的训练计算性能优化;支持大模型推理优化技术在异构硬件上的落地;
2、参与各种大模型推理所需的功能性开发任务;相关编译优化功能开发,以图优化、算子融合、GPU高性能算子开发及自动Codegen等技术手段不断推高在不同卡型上的计算性能极限;
3、参与支持日常的大模型推理服务部署,参与内部日常提效工具的研发。
任职要求:
1、硕士及以上学历,计算机、电子、自动化等专业优先;
2、熟悉python/C++,熟悉linux使用,有扎实的算法与数据结构基础;
3、有较强的自驱力和学习力,有严谨的科研思维,沟通良好擅长与人合作;
4、了解AI infra 整体技术栈,有大模型相关训练或推理优化实战经验;有vLLM、TensorRT-LLM、MLC-LLM、Tensorflow、PyTorch等框架之一的实践经验。
加分项:
1、熟悉CUDA 或 ROCM,熟悉Nsight System/ Nsight Compute 工具的使用,有 GPU 或 ASIC 高性能算子开发经验;
2、熟悉深度学习编译优化或异构硬件,有 XLA/ TVM /MLIR 开发、优化经验,熟悉pass编写或代码生成原理和实践;或有传统编译器开发经验,熟悉LLVM原理和使用;
3、有相关领域顶会paper发表;
4、有二次开发能力或开源社区贡献经历。
1、参与大模型推理/训练优化。通过研发业界领先的AI Compiler 技术,支撑搜推场景在GPU上的训练计算性能优化;支持大模型推理优化技术在异构硬件上的落地;
2、参与各种大模型推理所需的功能性开发任务;相关编译优化功能开发,以图优化、算子融合、GPU高性能算子开发及自动Codegen等技术手段不断推高在不同卡型上的计算性能极限;
3、参与支持日常的大模型推理服务部署,参与内部日常提效工具的研发。
任职要求:
1、硕士及以上学历,计算机、电子、自动化等专业优先;
2、熟悉python/C++,熟悉linux使用,有扎实的算法与数据结构基础;
3、有较强的自驱力和学习力,有严谨的科研思维,沟通良好擅长与人合作;
4、了解AI infra 整体技术栈,有大模型相关训练或推理优化实战经验;有vLLM、TensorRT-LLM、MLC-LLM、Tensorflow、PyTorch等框架之一的实践经验。
加分项:
1、熟悉CUDA 或 ROCM,熟悉Nsight System/ Nsight Compute 工具的使用,有 GPU 或 ASIC 高性能算子开发经验;
2、熟悉深度学习编译优化或异构硬件,有 XLA/ TVM /MLIR 开发、优化经验,熟悉pass编写或代码生成原理和实践;或有传统编译器开发经验,熟悉LLVM原理和使用;
3、有相关领域顶会paper发表;
4、有二次开发能力或开源社区贡献经历。
公司简介
快手是领先的内容社区和社交平台,是短视频行业开创者与引领者。快手致力于创造一个温暖和信任的社区,让更多普通人拥有表达和被看见的机会,并由此培育了繁荣与高互动的社区生态,每天有上千万优质内容上传。
VIP·学生版
会员6大特权,免费使用

简历置顶
免费

简历模版
免费

职业测评
免费

简历刷新
自动刷新

体验课程
免费

尊贵身份标识
免费
立即开通

智联安全提示
立即举报
用人单位若存在以下违法行为,请您提高警惕,立刻报警或者向平台举报: 1.强迫或者要求您投资入股、购买虚拟货币(如比特币)、转账、汇款等 2.要求您提供担保人、担保金或者以其他名义向您收取财物 3.以招聘名义向您牟取任何不正当利益(财产权益、人身权益) 4.扣押您的身份证件或者其他证件 5.要求您添加微信、QQ进行转账、汇款 6.其他损害您合法权益的行为等