Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Kwai logo
快手
大模型AI Infra底软/硬件加速工程师-【可灵AI专项】
立即应聘

大模型AI Infra底软/硬件加速工程师-【可灵AI专项】

发布于 大约 11 小时前

普通员工/个人贡献者

北京市
高级经验
全职员工
仅现场办公
学历未注明
软件工程
PyTorch
CUDA
GPU加速
分布式训练
vLLM
FSDP
Megatron

AI 估算 · 35k–60k

大模型AI基础设施岗位需求火热,高阶GPU编程和分布式优化技能稀缺,薪资竞争力强,预计中高级水平月薪在35-60K,加上年终奖金。

职位详情

关于这个职位

该职位聚焦于视频生成大模型和多模态大模型在最新硬件平台上的训练与推理性能优化,需要深入理解GPU体系结构和CUDA编程

你将参与大规模分布式训练系统的性能分析与稳定性提升,与顶尖团队合作推动AI基础设施达到极限性能

最低要求

掌握Python/C++编程语言,熟练使用Pytorch训练框架或SGlang/vLLM等大模型推理框架

掌握大模型领域基础算法知识,熟悉常规Transformer/SD模型结构,以及对应的常用性能优化方法
深刻理解GPU硬件体系结构,能熟练编写高性能cuda kernel

工作职责

负责视频生成大模型/多模态大模型在最新硬件平台上的训练/推理性能分析与优化,目标达成该硬件平台上的极限性能

负责分析并提升大规模分布式训练系统的集群性能,完成对大规模训练任务故障的根因定位与稳定性提升

优先资格

有分布式大模型训练框架(Megatron/FSDP)或分布式推理引擎开发经验者优先

有在超节点硬件环境上,做过训练/推理性能优化者优先
有GPU高性能算子库(Cutlass/Cute、PTX、汇编)、集合通信库(xCCL)、AI编译器(XLA/Dynamo)开发经验者优先

AI 洞察

优缺点分析

优点

  • 身处大模型浪潮核心,参与最前沿的视频生成技术,技术积累价值极高
  • 快手作为上市巨头,平台资源丰富,有机会使用顶级GPU集群和真实业务场景
  • 岗位技术壁垒高,掌握稀缺的底层优化能力,未来职业竞争力强
  • 需要同时具备算法理解、系统架构和硬件知识,学习曲线陡峭
  • 性能优化往往需要反复迭代和实验,工作强度可能较大,且需要应对复杂的分布式系统问题
  • 适合对计算机体系结构和底层性能优化充满热情、具备扎实的编程基础和GPU编程经验、渴望在大模型基础设施领域深耕的工程师

缺点 / 挑战

暂无明显挑战项

角色解读

  • 技术深耕:从GPU编程到AI编译器、硬件协同设计,成为高性能计算领域的专家
  • 架构演进:逐步参与分布式训练系统的架构设计与优化,主导集群级别性能优化项目
  • 团队领导:积累足够经验后,可带领底层优化团队,或转向AI基础设施架构师角色
  • 负责视频生成大模型(如可灵AI)在最新GPU硬件上的训练和推理性能分析与优化,通过CUDA编程和系统调优实现极限性能
  • 分析和提升大规模分布式训练系统的集群效率,定位并解决训练任务的故障根因,保障系统稳定性
  • 与算法团队协作,将最新模型结构适配到硬件平台,探索并实施前沿的加速技术(如算子融合、编译器优化)
  • 精通Python和C++,熟练使用PyTorch或vLLM/SGlang等大模型推理框架
  • 深入理解Transformer和扩散模型结构,熟悉常用性能优化方法(如算子融合、量化、并行策略)
  • 深刻理解GPU硬件体系结构,能熟练编写高性能CUDA kernel,具备底层性能调优能力

申请策略

  • 在简历和面试中多用量化数据(如“将训练速度提升30%”)来体现成果
  • 关注快手可灵AI的技术博客和开源项目,提前了解他们的技术栈和优化方向
  • 突出CUDA kernel编写经验,展示具体优化案例(如算子加速比、吞吐提升)
  • 强调分布式训练框架(Megatron/FSDP)的使用或开发经历,说明在集群规模、性能调优上的成果
  • 列出参与的AI项目(尤其是视频生成或多模态模型相关),体现对大模型算法结构的理解
  • 如有不足,可快速刷题实践CUDA编程,掌握Cutlass/Cute等库的使用
  • 熟悉PyTorch源码中与性能相关的模块(如autograd、cuda graph),并动手搭建简单分布式训练环境

面试指南

  • 对于性能优化问题,采用“问题分析—优化方案—实验验证—结果量化”的结构,突出思路和效果
  • 对于系统设计问题,先阐述核心概念和原理,再结合实际场景讨论权衡和选择
  • 请描述一次你优化CUDA kernel的经历,使用了哪些技术,最终效果如何?
  • 解释Transformer模型中的self-attention如何实现高效计算?你知道哪些优化方法?
  • Megatron的tensor parallelism和pipeline parallelism有什么区别?如何选择?
  • 在多机多卡训练中,如何诊断和解决通信瓶颈?
  • 如果在训练过程中出现loss异常或性能下降,你会如何排查?
  • 复习GPU硬件架构(如SM、warp、memory hierarchy)和CUDA编程模型,确保能手写简单的kernel

职位点评

74
综合评分

前沿大模型基础设施技术岗,薪资优厚、技术成长极高,但工作地点固定且可能面临一定强度。

更适合这类人
最看重技术成长和前沿挑战的求职者,愿意在快节奏中换取稀缺技能积累。
表现最好
成长发展
相对薄弱
工作生活
薪资福利85
成长发展90
工作生活50
使命价值70

薪资福利

85较高

快手作为上市大厂,薪资福利在行业中上水平,该岗位技术稀缺性驱动薪资偏高,且提供大平台保障,补偿性动机满足较好。

薪资信号偏高 (35K-60K/月)

成长发展

90较高

该岗位直接参与最前沿的大模型基础设施优化,技术栈前沿(GPU编程、分布式系统),成长空间极大,且快手内部有良好的技术氛围和晋升机制。

技术前沿前沿/新兴技术
技术栈CUDA、GPU、分布式训练、Transformer、vLLM、Megatron、FSDP
业务类型ambiguous

工作生活

50较低

北京核心地段办公,互联网大厂通常有一定强度,JD未明确WLB,但快手整体节奏适中,不过技术攻坚期可能需要加班。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值

70中等

从事AI前沿技术,对行业智能化有推动作用,但偏底层基础设施,直接社会影响力中等。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

快手 的其他在招职位

  • 招聘实习生-【可灵】

    快手 · 北京市
    AI 估算 · 3k-6k
  • 快手健康行业运营实习生-【电商】

    快手 · 北京市
    AI 估算 · 4k-6k
  • AI 数据产品经理(运营方向)-【主站】

    快手 · 北京市
    AI 估算 · 20k-35k
  • 达人生态与内容运营实习生-【电商】

    快手 · 杭州市
    AI 估算 · 4k-6k
  • 数据产品实习生-【生活服务】

    快手 · 北京市
    AI 估算 · 5k-8k

相似职位推荐

  • Student Intern-SYNC

    西门子 · 上海市
    AI 估算 · 4k-6k
  • Advanced Software Engineer-C++

    飞利浦 · 沈阳市
    AI 估算 · 15k-25k
  • Advanced Software Engineer-C++

    飞利浦 · 沈阳市
    AI 估算 · 25k-40k
  • 2027 Campus - Software Development Engineer - Industrial & IoT

    恩智浦半导体 · 北京市
    AI 估算 · 15k-25k
  • 大模型推理部署优化实习生-AI引擎

    米哈游 · 上海市
    AI 估算 · 4k-8k

快手 的其他在招职位

  • 招聘实习生-【可灵】

    快手 · 北京市
    AI 估算 · 3k-6k
  • 快手健康行业运营实习生-【电商】

    快手 · 北京市
    AI 估算 · 4k-6k
  • AI 数据产品经理(运营方向)-【主站】

    快手 · 北京市
    AI 估算 · 20k-35k
  • 达人生态与内容运营实习生-【电商】

    快手 · 杭州市
    AI 估算 · 4k-6k
  • 数据产品实习生-【生活服务】

    快手 · 北京市
    AI 估算 · 5k-8k

相似职位推荐

  • Student Intern-SYNC

    西门子 · 上海市
    AI 估算 · 4k-6k
  • Advanced Software Engineer-C++

    飞利浦 · 沈阳市
    AI 估算 · 15k-25k
  • Advanced Software Engineer-C++

    飞利浦 · 沈阳市
    AI 估算 · 25k-40k
  • 2027 Campus - Software Development Engineer - Industrial & IoT

    恩智浦半导体 · 北京市
    AI 估算 · 15k-25k
  • 大模型推理部署优化实习生-AI引擎

    米哈游 · 上海市
    AI 估算 · 4k-8k