Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Kwai logo
快手
【快Star】大模型推理/训练优化工程师
立即应聘

【快Star】大模型推理/训练优化工程师

发布于 大约 2 小时前

普通员工/个人贡献者

北京市
高级经验
全职员工
仅现场办公
硕士
PyTorch
GPU优化
CUDA
vLLM
大模型推理
TensorRT-LLM
大模型训练
Ai Compiler

AI 估算 · 25k–45k

大模型优化岗位技能稀缺,快手作为大厂薪资具有竞争力,月薪中位数在35K左右。

职位详情

关于这个职位

该职位主要负责大模型推理和训练的性能优化,利用AI Compiler技术提升GPU计算性能,支撑搜推场景

同时参与推理服务部署和内部提效工具开发,需要深入理解AI Infra技术栈

最低要求

硕士及以上学历,计算机、电子、自动化等专业优先

熟悉python/C++,熟悉linux使用,有扎实的算法与数据结构基础
有较强的自驱力和学习力,有严谨的科研思维,沟通良好擅长与人合作
了解AI infra整体技术栈,有大模型相关训练或推理优化实战经验
有vLLM、TensorRT-LLM、MLC-LLM、Tensorflow、PyTorch等框架之一的实践经验

工作职责

参与大模型推理/训练优化

通过研发业界领先的AI Compiler技术,支撑搜推场景在GPU上的训练计算性能优化
支持大模型推理优化技术在异构硬件上的落地
参与各种大模型推理所需的功能性开发任务
相关编译优化功能开发,以图优化、算子融合、GPU高性能算子开发及自动Codegen等技术手段不断推高在不同卡型上的计算性能极限
参与支持日常的大模型推理服务部署,参与内部日常提效工具的研发

优先资格

熟悉CUDA或ROCM,熟悉Nsight System/Nsight Compute工具的使用,有GPU或ASIC高性能算子开发经验

熟悉深度学习编译优化或异构硬件,有XLA/TVM/MLIR开发、优化经验,熟悉pass编写或代码生成原理和实践
或有传统编译器开发经验,熟悉LLVM原理和使用
有相关领域顶会paper发表
有二次开发能力或开源社区贡献经历

AI 洞察

优缺点分析

优点

  • 大模型是当前最热技术方向,职位技术前沿,积累经验极具市场价值
  • 快手拥有海量搜推场景,业务驱动技术落地,成长空间大
  • 团队技术氛围浓厚,有机会接触业内顶尖的AI Compiler与GPU优化技术

缺点 / 挑战

  • 技术栈更新快,需要持续学习新框架和硬件特性,学习压力大
  • 性能优化往往需要反复调试与实验,工作强度较高
  • 对底层系统理解要求高,入门门槛相对较高
  • 适合对系统性能优化有热情、自驱力强、乐于挑战技术难题的候选人,尤其是具备GPU编程或编译器背景的工程师

角色解读

  • 深耕GPU编译优化与高性能计算,成为AI Infra专家
  • 向大模型系统架构师方向演进,负责整体推理/训练平台设计
  • 可转向AI芯片或异构计算领域,拓展硬件协同设计能力
  • 参与大模型推理和训练的性能优化,通过AI Compiler技术提升GPU计算效率
  • 开发推理所需的功能模块,包括图优化、算子融合和高性能算子
  • 支持大模型推理服务的日常部署,并研发内部提效工具
  • 精通Python和C++,具备扎实的算法与数据结构基础
  • 熟悉AI Infra技术栈,有大模型训练或推理优化实战经验
  • 掌握至少一种主流框架(如vLLM、TensorRT-LLM、PyTorch)

申请策略

  • 提前了解快手搜推业务场景,思考如何优化落地
  • 展示自己的技术热情和快速学习能力,可附上技术博客或GitHub
  • 突出大模型训练/推理优化项目经验,量化性能提升指标
  • 强调CUDA或其他异构计算编程能力,展示算子开发成果
  • 提及相关开源贡献或顶会论文,体现技术深度
  • 系统学习CUDA编程和GPU架构,掌握Nsight工具使用
  • 深入理解至少一个推理框架(如vLLM、TensorRT-LLM)的源码
  • 熟悉MLIR/TVM等编译器框架,动手编写优化pass

面试指南

  • STAR法则:描述场景、任务、行动、结果,量化收益
  • 从问题根源出发,给出多个解决方案并比较优劣
  • 结合底层原理和实际表现,展示系统化思维
  • 请介绍你在大模型推理优化方面的一个具体项目,遇到了什么挑战?
  • 解释CUDA中的warp级编程和shared memory优化技巧
  • Transformer模型推理时,如何做KV-cache优化?
  • 你如何调优GPU kernel的Occupancy和带宽利用率?
  • 对比vLLM和TensorRT-LLM的架构差异及适用场景

匹配度报告

69
综合匹配度

大厂核心AI Infra岗位,前沿技术栈,薪资可观,但现场办公且可能面临较大工作压力。

适合人群
最适合追求技术成长和前沿领域的求职者,尤其是愿意在AI Infra方向深耕的工程师。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利70
成长发展90
工作生活50
使命价值65

薪资福利匹配

70中等

快手作为上市公司,薪资水平具有竞争力,但JD未明确福利细节,补偿性动机满足程度中等偏上。

薪资信号未披露(AI估算:25K-45K/月)

成长发展匹配

90较高

该职位处于大模型前沿技术领域,涉及AI Compiler、GPU优化等高端技能,发展性动机得到充分满足。

技术前沿前沿/新兴技术
技术栈AI Compiler、GPU、CUDA、vLLM、TensorRT-LLM、PyTorch
业务类型profit_center

工作生活匹配

50较低

职位要求现场办公,未提及弹性工作或加班情况,生活化动机满足程度一般。

工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值匹配

65中等

大模型是高速增长赛道,但社会影响力中性,使命导向不强,意义感动机中等。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

快手 的其他在招职位

  • 【快Star】多模态理解算法研究员

    快手 · 深圳市
    AI 估算 · 25k-45k
  • 【快Star】大模型系统开发工程师

    快手 · 北京市
    AI 估算 · 25k-35k
  • 【快Star】数据科学家

    快手 · 北京市
    AI 估算 · 25k-45k
  • 【快Star】具身智能算法研究员

    快手 · 北京市
    AI 估算 · 30k-50k
  • 【快Star】搜索大模型算法工程师

    快手 · 杭州市
    AI 估算 · 30k-60k

快手 的其他在招职位

  • 【快Star】多模态理解算法研究员

    快手 · 深圳市
    AI 估算 · 25k-45k
  • 【快Star】大模型系统开发工程师

    快手 · 北京市
    AI 估算 · 25k-35k
  • 【快Star】数据科学家

    快手 · 北京市
    AI 估算 · 25k-45k
  • 【快Star】具身智能算法研究员

    快手 · 北京市
    AI 估算 · 30k-50k
  • 【快Star】搜索大模型算法工程师

    快手 · 杭州市
    AI 估算 · 30k-60k