Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Kwai logo
快手
【快Star】推荐大模型训练引擎研发工程师
立即应聘

【快Star】推荐大模型训练引擎研发工程师

发布于 大约 2 小时前

普通员工/个人贡献者

北京市
中级经验
全职员工
仅现场办公
学历未注明
PyTorch
TensorFlow
推荐系统
分布式训练
大模型
MoE
PaddlePaddle
算子优化
Mindspore

AI 估算 · 30k–60k

快手上市大厂,推荐大模型训练引擎岗位技术门槛高,北京市场薪资竞争力强,参考同级别研发岗

职位详情

关于这个职位

该职位是快手推荐大模型训练引擎研发工程师,主要负责自研生成式推荐大模型OneRec的训练全链路开发与优化,涉及分布式训练框架设计、算子优化和算法工程协同

适合有C++和深度学习框架深度使用经验、对大规模分布式训练和大模型技术有热情的工程师

最低要求

精通C++编程,有较好的编程风格和代码管理能力

有优秀的逻辑分析能力,有较好的数学基础
至少对pytorch/tensorflow/paddlepaddle/mindspore之中任一框架有较丰富的使用经验和二次开发经验

工作职责

深度参与快手自研生成式推荐大模型(OneRec)训练全链路开发和优化,以及快手广告、电商、直播、搜索等全域模型的训练全链路研发与优化

设计和优化分布式训练框架,通过算子优化、通信计算overlap、低精度训练等方法解决超长序列、超大规模moe场景下的训练效率问题
算法工程co-design,探索最优的训练范式

优先资格

有大模型算法领域知识者优先

有大模型训练infra相关从业经验者优先

AI 洞察

优缺点分析

优点

  • 快手拥有海量用户和业务场景,能接触到真实大规模分布式训练问题
  • 公司技术氛围浓厚,团队自研OneRec模型,技术积累扎实
  • 技术栈深,对C++、分布式系统和大模型训练Infra要求高,学习曲线陡峭
  • 需要同时理解算法和工程,跨领域协作要求高

缺点 / 挑战

  • 身处推荐大模型前沿赛道,技术挑战大,成长空间广阔
  • 工作强度可能较高,需要快速迭代和解决复杂性能问题
  • 适合精通C++、深度学习框架并有底层优化经验,对大规模分布式训练和大模型技术有浓厚兴趣,愿意挑战高难度工程问题的工程师

角色解读

  • 技术纵深:在分布式训练、大模型Infra领域深耕,成为训练系统专家或架构师
  • 横向拓展:接触推荐系统全链路,可向推荐算法、AI平台等方向扩展
  • 管理路径:积累团队协作经验后,可晋升为技术负责人或团队主管
  • 深度参与自研生成式推荐大模型OneRec的训练全链路开发,涵盖广告、电商、直播、搜索等核心业务模型的训练优化
  • 设计和优化分布式训练框架,解决超长序列、超大规模MoE等场景下的训练效率瓶颈
  • 与算法团队紧密协作,通过算子优化、通信计算重叠、低精度训练等手段提升训练性能
  • 精通C++编程,具备扎实的编程风格和代码管理能力
  • 熟练使用至少一种主流深度学习框架(PyTorch/TensorFlow/PaddlePaddle/MindSpore),并有框架二次开发经验
  • 熟悉分布式训练原理,有大规模分布式训练系统优化经验者优先
  • 具备数学和逻辑分析能力,能够理解复杂算法并转化为高效工程实现

申请策略

  • 在简历中突出与推荐大模型训练相关的项目,如果有开源贡献更好
  • 了解快手的推荐业务和技术栈,面试时展示对其技术挑战的理解
  • 突出C++编程能力:展示大型项目或开源贡献,强调代码质量和优化经验
  • 强化分布式训练经验:如大模型训练、算子优化、通信优化等相关项目
  • 体现框架二次开发能力:如对PyTorch源码的修改或自定义算子开发
  • 若有推荐系统或大模型算法背景,需重点提及
  • 系统学习分布式训练原理,尤其是数据并行、模型并行、流水线并行等
  • 深入研究一个深度学习框架的源码(如PyTorch的Distributed模块)

面试指南

  • 对于优化类问题,采用'问题→方案→效果'结构:先说明瓶颈,再提出具体技术手段(如算子融合、梯度压缩等),最后展示量化收益
  • 对于原理类问题,先清晰阐述基本概念,再结合自身经验举例说明
  • 请详细介绍你参与过的一个分布式训练优化项目,包括遇到的问题和解决方案
  • 如何优化PyTorch的DataLoader以提升训练吞吐?
  • 解释MoE(混合专家)模型的训练挑战及常用优化策略
  • 什么是通信计算overlap?如何实现?
  • 在大规模分布式训练中,如何平衡计算和通信开销?
  • 复习分布式训练经典论文(如Megatron-LM、DeepSpeed、ZeRO系列)

匹配度报告

62
综合匹配度

快手核心推荐大模型训练引擎岗,技术前沿且成长空间巨大,但工作强度大、WLB一般。

适合人群
最适合追求技术成长、愿意在高压环境下攻克前沿难题的工程师。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利70
成长发展90
工作生活30
使命价值60

薪资福利匹配

70中等

快手上市大厂,研发岗位薪资有竞争力,但JD未明确薪资和福利,补偿性动机满足程度中等偏上。

薪资信号未披露(AI估算:30K-60K/月)

成长发展匹配

90较高

职位涉及前沿的大模型训练引擎优化,技术挑战大,成长空间极强,发展性动机充分满足。

技术前沿前沿/新兴技术
技术栈C++、PyTorch、TensorFlow、分布式训练、大模型、MoE、算子优化、低精度训练、通信计算overlap
业务类型profit_center

工作生活匹配

30较低

JD未提及远程或弹性办公,工作地点在北京,属于仅现场办公,且大厂研发岗通常强度较高,WLB一般。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

60中等

推荐大模型技术本身属于前沿领域,但社会影响力中性,使命导向不明显。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

快手 的其他在招职位

  • 【快Star】多模态理解算法研究员

    快手 · 深圳市
    AI 估算 · 25k-45k
  • 【快Star】大模型系统开发工程师

    快手 · 北京市
    AI 估算 · 25k-35k
  • 【快Star】数据科学家

    快手 · 北京市
    AI 估算 · 25k-45k
  • 【快Star】具身智能算法研究员

    快手 · 北京市
    AI 估算 · 30k-50k
  • 【快Star】搜索大模型算法工程师

    快手 · 杭州市
    AI 估算 · 30k-60k

快手 的其他在招职位

  • 【快Star】多模态理解算法研究员

    快手 · 深圳市
    AI 估算 · 25k-45k
  • 【快Star】大模型系统开发工程师

    快手 · 北京市
    AI 估算 · 25k-35k
  • 【快Star】数据科学家

    快手 · 北京市
    AI 估算 · 25k-45k
  • 【快Star】具身智能算法研究员

    快手 · 北京市
    AI 估算 · 30k-50k
  • 【快Star】搜索大模型算法工程师

    快手 · 杭州市
    AI 估算 · 30k-60k