2026-03-13 更新
收藏
微信扫码分享

【快Star-X】多模态推理引擎工程师 面议

北京在校/应届本科校园若干

立即投递

优选专业

计算机类

职位描述

职位描述
参与快手大模型推理引擎研发,工作内容包括:
1、参与大模型推理引擎的设计和研发,支撑快手自研以及开源模型的快速部署和高性能推理
2、通过各种技术手段持续优化性能,降低推理成本,包括但不限于:算子/编译优化、异构推理、模型量化&蒸馏、分布式并行等
3、支持RL中的多样化采样、generation性能优化等
任职要求:
1、有较强的学习能力和编程能力及数学基础
2、有开源大模型推理框架(vllm/slang/trt-llm)使用和优化经验者优先
3、有cuda或triton开发优化gpu算子经验者优先
4、有算力芯片优化经验者优先
5、有同领域相关实习经验者优先

公司简介

快手是领先的内容社区和社交平台,是短视频行业开创者与引领者。快手致力于创造一个温暖和信任的社区,让更多普通人拥有表达和被看见的机会,并由此培育了繁荣与高互动的社区生态,每天有上千万优质内容上传。

VIP·学生版

会员8大特权,免费使用

职业测评

免费

新发岗推荐

免费

竞争力分析

免费

AI改简历

免费

简历模版

免费

AI模拟面试

免费

1V1 HR导师

免费

尊贵身份标识

免费

立即开通

智联安全提示

立即举报

用人单位若存在以下违法行为,请您提高警惕,立刻报警或者向平台举报: 1.强迫或者要求您投资入股、购买虚拟货币(如比特币)、转账、汇款等 2.要求您提供担保人、担保金或者以其他名义向您收取财物 3.以招聘名义向您牟取任何不正当利益(财产权益、人身权益) 4.扣押您的身份证件或者其他证件 5.要求您添加微信、QQ进行转账、汇款 6.其他损害您合法权益的行为等

查看全部

北京达佳互联信息技术有限公司

所属行业:互联网

企业规模:10000人以上

企业性质:上市公司

查看企业详情