Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/快手/大模型推理引擎研发工程师
Kwai logo
K
快手 (Kwai)

职位信息

北京市
中级经验
全职员工
仅现场办公
学历未注明
普通员工/个人贡献者

标签

CUDA模型量化推理引擎vLLM大模型推理TensorRT-LLMGpu算子优化分布式并行
💡

核心评价

前沿大厂技术岗,高成长潜力,薪资竞争力强,需现场办公。

大模型推理引擎研发工程师

🤖 AI 估测:¥35K-60K

发布时间:15 天前

立即应聘

ℹ️关于这个职位

该职位是快手公司的大模型推理引擎研发工程师,主要负责参与大模型推理引擎的设计、研发与性能优化工作
你将支撑快手自研及开源模型的快速部署与高性能推理,通过算子优化、模型量化、分布式并行等技术手段,持续降低推理成本并提升效率

✓工作职责

参与大模型推理引擎的设计和研发,支撑快手自研以及开源模型的快速部署和高性能推理;
通过各种技术手段持续优化性能,降低推理成本,包括但不限于:算子/编译优化、异构推理、模型量化&蒸馏、分布式并行等;
支持RL中的多样化采样、generation性能优化等

⭐最低要求

有较强的学习能力和编程能力及数学基础

👍优先资格

有开源大模型推理框架(vllm/slang/trt-llm)使用和优化经验者优先
有cuda或triton开发优化gpu算子经验者优先
有昇腾、寒武纪、沐曦、海光、AMD 等算力芯片优化经验者优先
有大模型推理相关从业经验者优先
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

快手 的其他在招职位

  • 履约体验运营-【电商】

    快手

    杭州市 · 仅现场办公

  • 【留用实习】大模型AI Infra底软/硬件加速工程师

    快手

    上海市 · 仅现场办公

  • 大模型AI Infra底软/硬件加速工程师

    快手

    北京市 · 仅现场办公

  • 【留用实习】策略产品经理-社区治理

    快手

    北京市 · 仅现场办公

  • 【快Star-X】大模型AI Infra底软/硬件加速工程师

    快手

    北京市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公