Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/快手/模型推理优化专家
Kwai logo
K
快手 (Kwai)

职位信息

北京市
高级经验
全职员工
仅现场办公
学历未注明
普通员工/个人贡献者

标签

深度学习系统设计PyTorchCUDATensorRTMLIR模型推理优化TVM
💡

核心评价

大厂核心业务AI推理专家岗,技术前沿成长快,薪资竞争力强,WLB信息不明。

模型推理优化专家

🤖 AI 估测:¥45K-80K

发布时间:21 天前

立即应聘

ℹ️关于这个职位

这是一个专注于深度学习模型推理性能优化的技术专家岗位
你将负责快手搜索业务中大规模模型推理框架的研发与优化,通过技术手段提升服务的高吞吐与低延迟,并支持大模型在搜索场景(如AI检索、Query改写)的落地应用
核心目标是保障数亿用户搜索体验的稳定与高效

✓工作职责

参与快手大规模深度学习推理框架的研发与优化,保障在线系统的高可用/高并发,为快手搜索数亿用户提供高效稳定的算力输出
负责快手搜索模型推理优化工作,优化模型推理性能,高吞吐低延时支撑模型推理服务
支持大模型在搜索场景落地的相关模型优化,包括不局限于AI检索,Query改写等

⭐最低要求

熟悉Linux开发环境,良好的系统编程、数据结构、算法基础、系统设计能力
掌握C++/Python编程语言
熟悉tensorflow、pytorch、TensorRT, Faster Transformer等主流训练和推理框架,并有相关优化经验者优先
熟悉编译优化技术及相关框架,如MLIR、TVM、XLA
有显存优化、算子融合、图优化等实操经验
熟悉CUDA编程,具备较好开发能力,熟悉triton、cutlass、有算子库开发经验者优先
有搜推广模型系统优化经验者优先
具有良好的团队合作精神和沟通能力,能够对算法和底层的协同优化起到核心桥梁作用

👍优先资格

熟悉tensorflow、pytorch、TensorRT, Faster Transformer等主流训练和推理框架,并有相关优化经验者优先
熟悉CUDA编程,具备较好开发能力,熟悉triton、cutlass、有算子库开发经验者优先
有搜推广模型系统优化经验者优先
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

快手 的其他在招职位

  • 履约体验运营-【电商】

    快手

    杭州市 · 仅现场办公

  • 【留用实习】大模型AI Infra底软/硬件加速工程师

    快手

    上海市 · 仅现场办公

  • 大模型AI Infra底软/硬件加速工程师

    快手

    北京市 · 仅现场办公

  • 【留用实习】策略产品经理-社区治理

    快手

    北京市 · 仅现场办公

  • 【快Star-X】大模型AI Infra底软/硬件加速工程师

    快手

    北京市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公