Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Kwai logo
快手
【快Star】大模型分布式推理框架工程师
立即应聘

【快Star】大模型分布式推理框架工程师

发布于 大约 2 小时前

普通员工/个人贡献者

北京市
中级经验
全职员工
仅现场办公
学历未注明
GPU
高性能计算
多模态
量化
模型压缩
大模型
vLLM
分布式推理
稀疏化

AI 估算 · 35k–60k

快手上市大厂,大模型方向稀缺,年薪总包约50-100万,月薪按16薪折算。

职位详情

关于这个职位

这是一个与顶尖算法工程师合作、研发高性能分布式推理系统的岗位,专注于优化视频生成和多模态大模型的推理效率,适合对AI Infra有热情的技术人才

最低要求

计算机、软件工程、人工智能相关专业,熟悉计算机体系结构基础知识

具备扎实的分布式推理引擎、调度、网络、存储开发经验,了解模型压缩算法(量化/稀疏等)、高性能Kernel开发技术
具有良好的团队合作精神和沟通能力,积极乐观、具备抗压能力、自驱能力

工作职责

和领域内最顶尖的算法工程师合作,一起研发业内领先的高性能分布式推理系统,优化目标包括但不限于视频生成大模型、多模态大模型

对自研多模态推理引擎进行深度优化,提升分布式推理的效率和稳定性
持续关注并跟进业界技术发展,调研大模型推理优化方向最新论文

优先资格

有Nvidia GPU 算子开发经验者优先

有突出的学术背景和创新研究能力,在相关领域发表过高水平论文、专利
对大语言系统优化及相关前沿算法有深入务实的实战经验
熟悉Kubernetes、Mooncake、Ray、AIBrix、Dynamo、vLLM、SGlang等开源项目

AI 洞察

优缺点分析

优点

  • 与顶级算法工程师合作,积累高质量人脉和项目经验
  • 大模型方向薪资待遇优厚,行业需求旺盛
  • 技术深度和广度要求高,需同时掌握分布式系统、GPU编程和模型压缩
  • 工作节奏可能较快,需要较强的抗压能力和自驱力
  • 领域更新迅速,需要持续学习跟进最新论文和技术
  • 适合对AI Infra有浓厚兴趣、具备扎实系统能力、渴望在大模型领域深耕的技术型人才

缺点 / 挑战

  • 参与前沿大模型推理系统研发,技术挑战大,成长空间广阔

角色解读

  • 从分布式推理工程师成长为AI Infra架构师,主导大规模推理系统的设计与优化
  • 深入大模型底层技术,未来可转向算法研究或系统架构方向
  • 在快手核心业务中积累经验,成为AI基础设施领域的专家
  • 与顶尖算法工程师协作,研发高性能分布式推理系统,重点优化视频生成和多模态大模型
  • 对自研多模态推理引擎进行深度优化,提升分布式推理的效率和稳定性
  • 跟踪业界最新技术,调研大模型推理优化方向的论文和技术方案
  • 扎实的计算机体系结构知识,熟悉分布式系统原理
  • 掌握分布式推理引擎开发、模型压缩(量化/稀疏)和高性能Kernel开发
  • 熟悉GPU编程(CUDA)及主流推理框架(如vLLM、SGlang)

申请策略

  • 了解快手在视频生成和多模态大模型方面的业务方向,在面试中体现对业务场景的理解
  • 提前准备一个自己参与过的分布式优化项目,详细讲述挑战和解决方案
  • 突出分布式系统开发经验,尤其是推理引擎、调度、网络、存储相关项目
  • 展示GPU编程(CUDA)和高性能Kernel开发的实际成果
  • 如果参与过模型压缩(量化/稀疏)或熟悉vLLM等开源项目,务必强调
  • 列出相关论文、专利或开源贡献,体现学术或工程影响力
  • 深入学习CUDA和GPU算子开发,尝试复现前沿推理优化论文
  • 熟悉Kubernete、Ray等分布式框架,动手搭建小规模推理集群

面试指南

  • 使用STAR方法:情境-任务-行动-结果,结构化描述项目经验
  • 遇到技术问题时,先分析根本原因,再比较不同方案,最后给出最佳实践
  • 对于系统设计问题,从需求出发,考虑扩展性、稳定性和性能三者平衡
  • 请介绍一个你优化过的分布式推理系统,遇到了哪些瓶颈,如何解决的?
  • 解释一下模型量化对推理性能的影响,以及如何选择量化方案?
  • CUDA编程中,如何优化Kernel的吞吐量和延迟?
  • 对比vLLM和Triton Inference Server的架构差异
  • 如何在大规模集群上实现高效的模型并行和数据并行?

匹配度报告

70
综合匹配度

大模型赛道高成长高薪酬,技术前沿但工作生活平衡一般。

适合人群
适合追求技术成长和薪资回报、能接受高强度工作的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展95
工作生活30
使命价值70

薪资福利匹配

85较高

快手上市大厂,薪酬具有竞争力,但JD中未明确薪资福利细节,因此薪酬信号为'未披露',但可推断待遇优厚。

薪资信号未披露(AI估算:35K-60K/月)

成长发展匹配

95较高

该职位处于大模型前沿领域,技术栈先进,与顶尖团队合作,成长空间极大。

技术前沿前沿/新兴技术
技术栈分布式推理、GPU、模型压缩、量化、稀疏化、Kubernetes、vLLM
业务类型profit_center

工作生活匹配

30较低

JD未提及工作模式或WLB,互联网大厂通常节奏较快,现场办公,灵活度较低。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值匹配

70中等

大模型领域增长迅猛,技术影响力大,但未体现明确的社会使命或价值观。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

快手 的其他在招职位

  • 【快Star】多模态理解算法研究员

    快手 · 深圳市
    AI 估算 · 25k-45k
  • 【快Star】大模型系统开发工程师

    快手 · 北京市
    AI 估算 · 25k-35k
  • 【快Star】数据科学家

    快手 · 北京市
    AI 估算 · 25k-45k
  • 【快Star】具身智能算法研究员

    快手 · 北京市
    AI 估算 · 30k-50k
  • 【快Star】搜索大模型算法工程师

    快手 · 杭州市
    AI 估算 · 30k-60k

快手 的其他在招职位

  • 【快Star】多模态理解算法研究员

    快手 · 深圳市
    AI 估算 · 25k-45k
  • 【快Star】大模型系统开发工程师

    快手 · 北京市
    AI 估算 · 25k-35k
  • 【快Star】数据科学家

    快手 · 北京市
    AI 估算 · 25k-45k
  • 【快Star】具身智能算法研究员

    快手 · 北京市
    AI 估算 · 30k-50k
  • 【快Star】搜索大模型算法工程师

    快手 · 杭州市
    AI 估算 · 30k-60k