快手的【快Star】推荐大模型训练引擎研发工程师薪资是多少？

该职位薪资范围为 30k–60k（人民币/月）。

【快Star】推荐大模型训练引擎研发工程师的工作地点在哪里？

该职位工作地点位于北京市。工作形式为仅现场办公。

快手的【快Star】推荐大模型训练引擎研发工程师有什么任职要求？

该职位要求学历未注明学历及中级经验工作经验。

快手

【快Star】推荐大模型训练引擎研发工程师

立即应聘

【快Star】推荐大模型训练引擎研发工程师

发布于大约 2 个月前

普通员工/个人贡献者

北京市

中级经验

全职员工

仅现场办公

学历未注明

软件工程

分布式训练

大模型

推荐系统

算子优化

Mindspore

MoE

PaddlePaddle

PyTorch

TensorFlow

AI 估算 · 30k–60k

快手上市大厂，推荐大模型训练引擎岗位技术门槛高，北京市场薪资竞争力强，参考同级别研发岗

职位详情

关于这个职位

该职位是快手推荐大模型训练引擎研发工程师，主要负责自研生成式推荐大模型OneRec的训练全链路开发与优化，涉及分布式训练框架设计、算子优化和算法工程协同

适合有C++和深度学习框架深度使用经验、对大规模分布式训练和大模型技术有热情的工程师

最低要求

精通C++编程，有较好的编程风格和代码管理能力

有优秀的逻辑分析能力，有较好的数学基础

至少对pytorch/tensorflow/paddlepaddle/mindspore之中任一框架有较丰富的使用经验和二次开发经验

工作职责

深度参与快手自研生成式推荐大模型（OneRec）训练全链路开发和优化，以及快手广告、电商、直播、搜索等全域模型的训练全链路研发与优化

设计和优化分布式训练框架，通过算子优化、通信计算overlap、低精度训练等方法解决超长序列、超大规模moe场景下的训练效率问题

算法工程co-design，探索最优的训练范式

优先资格

有大模型算法领域知识者优先

有大模型训练infra相关从业经验者优先

AI 洞察

优缺点分析

优点

快手拥有海量用户和业务场景，能接触到真实大规模分布式训练问题
公司技术氛围浓厚，团队自研OneRec模型，技术积累扎实
技术栈深，对C++、分布式系统和大模型训练Infra要求高，学习曲线陡峭
需要同时理解算法和工程，跨领域协作要求高

缺点 / 挑战

身处推荐大模型前沿赛道，技术挑战大，成长空间广阔
工作强度可能较高，需要快速迭代和解决复杂性能问题
适合精通C++、深度学习框架并有底层优化经验，对大规模分布式训练和大模型技术有浓厚兴趣，愿意挑战高难度工程问题的工程师

角色解读

技术纵深：在分布式训练、大模型Infra领域深耕，成为训练系统专家或架构师
横向拓展：接触推荐系统全链路，可向推荐算法、AI平台等方向扩展
管理路径：积累团队协作经验后，可晋升为技术负责人或团队主管
深度参与自研生成式推荐大模型OneRec的训练全链路开发，涵盖广告、电商、直播、搜索等核心业务模型的训练优化
设计和优化分布式训练框架，解决超长序列、超大规模MoE等场景下的训练效率瓶颈
与算法团队紧密协作，通过算子优化、通信计算重叠、低精度训练等手段提升训练性能
精通C++编程，具备扎实的编程风格和代码管理能力
熟练使用至少一种主流深度学习框架（PyTorch/TensorFlow/PaddlePaddle/MindSpore），并有框架二次开发经验
熟悉分布式训练原理，有大规模分布式训练系统优化经验者优先
具备数学和逻辑分析能力，能够理解复杂算法并转化为高效工程实现

申请策略

在简历中突出与推荐大模型训练相关的项目，如果有开源贡献更好
了解快手的推荐业务和技术栈，面试时展示对其技术挑战的理解
突出C++编程能力：展示大型项目或开源贡献，强调代码质量和优化经验
强化分布式训练经验：如大模型训练、算子优化、通信优化等相关项目
体现框架二次开发能力：如对PyTorch源码的修改或自定义算子开发
若有推荐系统或大模型算法背景，需重点提及
系统学习分布式训练原理，尤其是数据并行、模型并行、流水线并行等
深入研究一个深度学习框架的源码（如PyTorch的Distributed模块）

面试指南

对于优化类问题，采用'问题→方案→效果'结构：先说明瓶颈，再提出具体技术手段（如算子融合、梯度压缩等），最后展示量化收益
对于原理类问题，先清晰阐述基本概念，再结合自身经验举例说明
请详细介绍你参与过的一个分布式训练优化项目，包括遇到的问题和解决方案
如何优化PyTorch的DataLoader以提升训练吞吐？
解释MoE（混合专家）模型的训练挑战及常用优化策略
什么是通信计算overlap？如何实现？
在大规模分布式训练中，如何平衡计算和通信开销？
复习分布式训练经典论文（如Megatron-LM、DeepSpeed、ZeRO系列）

职位点评

综合评分

快手核心推荐大模型训练引擎岗，技术前沿且成长空间巨大，但工作强度大、WLB一般。

更适合这类人

最适合追求技术成长、愿意在高压环境下攻克前沿难题的工程师。

表现最好

成长发展

相对薄弱

工作生活

薪资福利70

成长发展90

工作生活30

使命价值60

薪资福利

70中等

快手上市大厂，研发岗位薪资有竞争力，但JD未明确薪资和福利，补偿性动机满足程度中等偏上。

薪资信号未披露（AI估算：30K-60K/月）

成长发展

90较高

职位涉及前沿的大模型训练引擎优化，技术挑战大，成长空间极强，发展性动机充分满足。

技术前沿前沿/新兴技术

技术栈C++、PyTorch、TensorFlow、分布式训练、大模型、MoE、算子优化、低精度训练、通信计算overlap

业务类型profit_center

工作生活

30较低

JD未提及远程或弹性办公，工作地点在北京，属于仅现场办公，且大厂研发岗通常强度较高，WLB一般。

工作模式仅现场办公

办公地点市区核心地段

加班情况未提及（无法判断）

使命价值

60中等

推荐大模型技术本身属于前沿领域，但社会影响力中性，使命导向不明显。

行业发展高速增长赛道

社会影响中性/一般

创新程度积极采用新技术

Watch Jobs

快手

【快Star】推荐大模型训练引擎研发工程师

立即应聘

【快Star】推荐大模型训练引擎研发工程师

发布于大约 2 个月前

普通员工/个人贡献者

北京市

中级经验

全职员工

仅现场办公

学历未注明

软件工程

分布式训练

大模型

推荐系统

算子优化

Mindspore

MoE

PaddlePaddle

PyTorch

TensorFlow

AI 估算 · 30k–60k

快手上市大厂，推荐大模型训练引擎岗位技术门槛高，北京市场薪资竞争力强，参考同级别研发岗

职位详情

关于这个职位

适合有C++和深度学习框架深度使用经验、对大规模分布式训练和大模型技术有热情的工程师

最低要求

精通C++编程，有较好的编程风格和代码管理能力

有优秀的逻辑分析能力，有较好的数学基础

至少对pytorch/tensorflow/paddlepaddle/mindspore之中任一框架有较丰富的使用经验和二次开发经验

工作职责

深度参与快手自研生成式推荐大模型（OneRec）训练全链路开发和优化，以及快手广告、电商、直播、搜索等全域模型的训练全链路研发与优化

设计和优化分布式训练框架，通过算子优化、通信计算overlap、低精度训练等方法解决超长序列、超大规模moe场景下的训练效率问题

算法工程co-design，探索最优的训练范式

优先资格

有大模型算法领域知识者优先

有大模型训练infra相关从业经验者优先

AI 洞察

优缺点分析

优点

快手拥有海量用户和业务场景，能接触到真实大规模分布式训练问题
公司技术氛围浓厚，团队自研OneRec模型，技术积累扎实
技术栈深，对C++、分布式系统和大模型训练Infra要求高，学习曲线陡峭
需要同时理解算法和工程，跨领域协作要求高

缺点 / 挑战

身处推荐大模型前沿赛道，技术挑战大，成长空间广阔
工作强度可能较高，需要快速迭代和解决复杂性能问题
适合精通C++、深度学习框架并有底层优化经验，对大规模分布式训练和大模型技术有浓厚兴趣，愿意挑战高难度工程问题的工程师

角色解读

技术纵深：在分布式训练、大模型Infra领域深耕，成为训练系统专家或架构师
横向拓展：接触推荐系统全链路，可向推荐算法、AI平台等方向扩展
管理路径：积累团队协作经验后，可晋升为技术负责人或团队主管
深度参与自研生成式推荐大模型OneRec的训练全链路开发，涵盖广告、电商、直播、搜索等核心业务模型的训练优化
设计和优化分布式训练框架，解决超长序列、超大规模MoE等场景下的训练效率瓶颈
与算法团队紧密协作，通过算子优化、通信计算重叠、低精度训练等手段提升训练性能
精通C++编程，具备扎实的编程风格和代码管理能力
熟练使用至少一种主流深度学习框架（PyTorch/TensorFlow/PaddlePaddle/MindSpore），并有框架二次开发经验
熟悉分布式训练原理，有大规模分布式训练系统优化经验者优先
具备数学和逻辑分析能力，能够理解复杂算法并转化为高效工程实现

申请策略

在简历中突出与推荐大模型训练相关的项目，如果有开源贡献更好
了解快手的推荐业务和技术栈，面试时展示对其技术挑战的理解
突出C++编程能力：展示大型项目或开源贡献，强调代码质量和优化经验
强化分布式训练经验：如大模型训练、算子优化、通信优化等相关项目
体现框架二次开发能力：如对PyTorch源码的修改或自定义算子开发
若有推荐系统或大模型算法背景，需重点提及
系统学习分布式训练原理，尤其是数据并行、模型并行、流水线并行等
深入研究一个深度学习框架的源码（如PyTorch的Distributed模块）

面试指南

对于优化类问题，采用'问题→方案→效果'结构：先说明瓶颈，再提出具体技术手段（如算子融合、梯度压缩等），最后展示量化收益
对于原理类问题，先清晰阐述基本概念，再结合自身经验举例说明
请详细介绍你参与过的一个分布式训练优化项目，包括遇到的问题和解决方案
如何优化PyTorch的DataLoader以提升训练吞吐？
解释MoE（混合专家）模型的训练挑战及常用优化策略
什么是通信计算overlap？如何实现？
在大规模分布式训练中，如何平衡计算和通信开销？
复习分布式训练经典论文（如Megatron-LM、DeepSpeed、ZeRO系列）

职位点评

综合评分

快手核心推荐大模型训练引擎岗，技术前沿且成长空间巨大，但工作强度大、WLB一般。

更适合这类人

最适合追求技术成长、愿意在高压环境下攻克前沿难题的工程师。

表现最好

成长发展

相对薄弱

工作生活

薪资福利70

成长发展90

工作生活30

使命价值60

薪资福利

70中等

快手上市大厂，研发岗位薪资有竞争力，但JD未明确薪资和福利，补偿性动机满足程度中等偏上。

薪资信号未披露（AI估算：30K-60K/月）

成长发展

90较高

职位涉及前沿的大模型训练引擎优化，技术挑战大，成长空间极强，发展性动机充分满足。

技术前沿前沿/新兴技术

技术栈C++、PyTorch、TensorFlow、分布式训练、大模型、MoE、算子优化、低精度训练、通信计算overlap

业务类型profit_center

工作生活

30较低

JD未提及远程或弹性办公，工作地点在北京，属于仅现场办公，且大厂研发岗通常强度较高，WLB一般。

工作模式仅现场办公

办公地点市区核心地段

加班情况未提及（无法判断）

使命价值

60中等

推荐大模型技术本身属于前沿领域，但社会影响力中性，使命导向不明显。

行业发展高速增长赛道

社会影响中性/一般

创新程度积极采用新技术

Watch Jobs

【快Star】推荐大模型训练引擎研发工程师

职位详情

关于这个职位

最低要求

工作职责

优先资格

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

【快Star】推荐大模型训练引擎研发工程师

职位详情

关于这个职位

最低要求

工作职责

优先资格

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

快手 的其他在招职位

大客户销售经理（3c家电方向）-【电商】

UX设计实习生(场域导购与AI设计）-【电商】

快手达人运营-【电商】

大客户销售（酒旅方向）-【生活服务】

广告投放与达人营销实习生（可灵AI专项）

相似职位推荐

高级软件研发工程师

营销增长工程师/架构师

高级专家工程师-实线TL（运力平台方向）

高级算法工程师

高级/资深 agent研发工程师

快手 的其他在招职位

大客户销售经理（3c家电方向）-【电商】

UX设计实习生(场域导购与AI设计）-【电商】

快手达人运营-【电商】

大客户销售（酒旅方向）-【生活服务】

广告投放与达人营销实习生（可灵AI专项）

相似职位推荐

高级软件研发工程师

营销增长工程师/架构师

高级专家工程师-实线TL（运力平台方向）

高级算法工程师

高级/资深 agent研发工程师

快手的其他在招职位

快手的其他在招职位