优选专业
职位描述
职位描述:
1、负责异构计算芯片(GPU/NPU/ASIC等)的评估、选型与深度优化,构建面向业务场景的算力评估体系。
2、主导AI推理引擎在目标芯片上的设计与实现,实现毫秒级低延迟与高吞吐推理能力。
3、优化大规模模型训练框架的设计与实现,提升分布式训练效率,缩短模型迭代周期。
4、开发高性能算子库,突破芯片算力瓶颈,最大化硬件利用率。
5、推动异构编程范式革新,降低模型迁移成本,提升开发效率。
任职要求:
1、技术能力:
精通Linux环境下C/C++和Python开发,扎实的计算机体系结构、操作系统、编译原理基础。
深入理解深度学习框架底层实现(如TensorFlow/PyTorch的计算图优化、运行时调度等)。
熟悉至少一种主流异构计算架构(如NVIDIA CUDA、AMD ROCm、Google TPU等)及其编程模型。
具备高性能算子开发、模型训练/推理优化经验者优先。
2、经验背景:
在AI芯片评估、模型优化、高性能计算等领域有实际项目经验。
有顶级会议(ASPLOS、ISCA、MLSys等)论文发表或AI编译器技术(MLIR、TVM等)研究经验者优先。
3、综合素质:
具备优秀的算法思维、系统架构设计能力与工程实现能力。
对AI技术前沿有强烈兴趣,能快速学习并解决复杂技术问题。
1、负责异构计算芯片(GPU/NPU/ASIC等)的评估、选型与深度优化,构建面向业务场景的算力评估体系。
2、主导AI推理引擎在目标芯片上的设计与实现,实现毫秒级低延迟与高吞吐推理能力。
3、优化大规模模型训练框架的设计与实现,提升分布式训练效率,缩短模型迭代周期。
4、开发高性能算子库,突破芯片算力瓶颈,最大化硬件利用率。
5、推动异构编程范式革新,降低模型迁移成本,提升开发效率。
任职要求:
1、技术能力:
精通Linux环境下C/C++和Python开发,扎实的计算机体系结构、操作系统、编译原理基础。
深入理解深度学习框架底层实现(如TensorFlow/PyTorch的计算图优化、运行时调度等)。
熟悉至少一种主流异构计算架构(如NVIDIA CUDA、AMD ROCm、Google TPU等)及其编程模型。
具备高性能算子开发、模型训练/推理优化经验者优先。
2、经验背景:
在AI芯片评估、模型优化、高性能计算等领域有实际项目经验。
有顶级会议(ASPLOS、ISCA、MLSys等)论文发表或AI编译器技术(MLIR、TVM等)研究经验者优先。
3、综合素质:
具备优秀的算法思维、系统架构设计能力与工程实现能力。
对AI技术前沿有强烈兴趣,能快速学习并解决复杂技术问题。
公司简介
快手是领先的内容社区和社交平台,是短视频行业开创者与引领者。快手致力于创造一个温暖和信任的社区,让更多普通人拥有表达和被看见的机会,并由此培育了繁荣与高互动的社区生态,每天有上千万优质内容上传。
VIP·学生版
会员6大特权,免费使用

简历置顶
免费

简历模版
免费

职业测评
免费

简历刷新
自动刷新

体验课程
免费

尊贵身份标识
免费
立即开通

智联安全提示
立即举报
用人单位若存在以下违法行为,请您提高警惕,立刻报警或者向平台举报: 1.强迫或者要求您投资入股、购买虚拟货币(如比特币)、转账、汇款等 2.要求您提供担保人、担保金或者以其他名义向您收取财物 3.以招聘名义向您牟取任何不正当利益(财产权益、人身权益) 4.扣押您的身份证件或者其他证件 5.要求您添加微信、QQ进行转账、汇款 6.其他损害您合法权益的行为等