优选专业
职位描述
职位描述
1、推理引擎开发与优化: 参与 Diffusion 模型推理引擎的核心模块开发,学习并实践 CUDA 编程、算子优化与内存管理。协助将最新的学术优化手段(如 Flash Attention、Fused Kernels)落地到生产环境,提升模型推理速度;
2、模型压缩与加速:调研并实践模型压缩技术,包括量化、蒸馏和剪枝。参与将 FP16/BF16 模型转换为 INT8/FP8 格式,并在保证生成质量的前提下优化推理延迟;
3、网关与服务化系统建设:参与 AIGC 网关系统的后端开发,设计高并发、低延迟的请求调度逻辑。协助构建模型服务化接口,解决大规模推理请求下的队列管理与资源调度问题。
任职要求:
1、计算机科学、人工智能、数学或相关专业本科及以上学历;
2、具备扎实的计算机基础知识,熟练掌握数据结构、算法、操作系统及计算机网络原理;
3、熟练使用 Python 或 C++ 编程,代码风格良好,具备较强的 Debug 能力;
4、熟悉 PyTorch 等深度学习框架,理解计算图、反向传播等基本原理;
5、了解 Diffusion 模型(如 DDPM, Stable Diffusion, DiT 架构)的基本原理者优先。
1、推理引擎开发与优化: 参与 Diffusion 模型推理引擎的核心模块开发,学习并实践 CUDA 编程、算子优化与内存管理。协助将最新的学术优化手段(如 Flash Attention、Fused Kernels)落地到生产环境,提升模型推理速度;
2、模型压缩与加速:调研并实践模型压缩技术,包括量化、蒸馏和剪枝。参与将 FP16/BF16 模型转换为 INT8/FP8 格式,并在保证生成质量的前提下优化推理延迟;
3、网关与服务化系统建设:参与 AIGC 网关系统的后端开发,设计高并发、低延迟的请求调度逻辑。协助构建模型服务化接口,解决大规模推理请求下的队列管理与资源调度问题。
任职要求:
1、计算机科学、人工智能、数学或相关专业本科及以上学历;
2、具备扎实的计算机基础知识,熟练掌握数据结构、算法、操作系统及计算机网络原理;
3、熟练使用 Python 或 C++ 编程,代码风格良好,具备较强的 Debug 能力;
4、熟悉 PyTorch 等深度学习框架,理解计算图、反向传播等基本原理;
5、了解 Diffusion 模型(如 DDPM, Stable Diffusion, DiT 架构)的基本原理者优先。
公司简介
快手是领先的内容社区和社交平台,是短视频行业开创者与引领者。快手致力于创造一个温暖和信任的社区,让更多普通人拥有表达和被看见的机会,并由此培育了繁荣与高互动的社区生态,每天有上千万优质内容上传。
VIP·学生版
会员5大特权,免费使用
竞争力分析
免费
AI改简历
免费
简历模版
免费
职业测评
免费
尊贵身份标识
免费
立即开通
智联安全提示
立即举报![]()
用人单位若存在以下违法行为,请您提高警惕,立刻报警或者向平台举报: 1.强迫或者要求您投资入股、购买虚拟货币(如比特币)、转账、汇款等 2.要求您提供担保人、担保金或者以其他名义向您收取财物 3.以招聘名义向您牟取任何不正当利益(财产权益、人身权益) 4.扣押您的身份证件或者其他证件 5.要求您添加微信、QQ进行转账、汇款 6.其他损害您合法权益的行为等



