职位描述
工作职责:
1、模型量化与优化:负责CV/LLM的量化方案设计、包括但不限于PTQ、QAT、知识蒸馏等
2、结合硬件优化量化算法:提升INT8/FP8等低精度模型的推理精度与效率,解决模型部署中的性能瓶颈。
3、软硬件协同设计:基于芯片架构特性,开发模拟算子进行仿真分析,以及设计算子融合、内存优化等联合优化策略,提升端侧推理速度
4、全流程部署支持:对接芯片设计团队,实现业界主流AI模型部署评估策略。
任职资格:
1、熟悉计算机体系结构以及相关量化分析方法,编译原理、mlir、11vm
2、有AI编译器开发经验,至少有算子融合、自动调优、访存优化的一种或几种经验
3、了解Triton、tvm、xlagsycl、torchinductor、openc1等软件生态
4、有11m推理性能优化以及相关编译优化经验优先
1、模型量化与优化:负责CV/LLM的量化方案设计、包括但不限于PTQ、QAT、知识蒸馏等
2、结合硬件优化量化算法:提升INT8/FP8等低精度模型的推理精度与效率,解决模型部署中的性能瓶颈。
3、软硬件协同设计:基于芯片架构特性,开发模拟算子进行仿真分析,以及设计算子融合、内存优化等联合优化策略,提升端侧推理速度
4、全流程部署支持:对接芯片设计团队,实现业界主流AI模型部署评估策略。
任职资格:
1、熟悉计算机体系结构以及相关量化分析方法,编译原理、mlir、11vm
2、有AI编译器开发经验,至少有算子融合、自动调优、访存优化的一种或几种经验
3、了解Triton、tvm、xlagsycl、torchinductor、openc1等软件生态
4、有11m推理性能优化以及相关编译优化经验优先
公司简介
2026届暑期开放日开启报名
VIP·学生版
会员8大特权,免费使用
职业测评
免费
新发岗推荐
免费
竞争力分析
免费
AI改简历
免费
简历模版
免费
AI模拟面试
免费
1V1 HR导师
免费
尊贵身份标识
免费
立即开通
智联安全提示
立即举报![]()
用人单位若存在以下违法行为,请您提高警惕,立刻报警或者向平台举报: 1.强迫或者要求您投资入股、购买虚拟货币(如比特币)、转账、汇款等 2.要求您提供担保人、担保金或者以其他名义向您收取财物 3.以招聘名义向您牟取任何不正当利益(财产权益、人身权益) 4.扣押您的身份证件或者其他证件 5.要求您添加微信、QQ进行转账、汇款 6.其他损害您合法权益的行为等



