Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
豆包大模型算法工程师-火山方舟
立即应聘

豆包大模型算法工程师-火山方舟

发布于 大约 16 小时前

普通员工/个人贡献者

北京市
高级经验
全职员工
仅现场办公
本科
PyTorch
强化学习
SFT
分布式训练
大模型
RL
vLLM
PPO
Grpo

AI 估算 · 30k–60k

大厂核心算法岗,技术前沿且稀缺,市场竞争力强,薪资有溢价。

职位详情

关于这个职位

该职位专注于大模型强化学习训练系统的开发与优化,包括改进RL训练框架、提升SFT/RL训练性能和稳定性,并探索前沿算法(如Off-Policy RL、SRFT等)

你将加入字节跳动火山方舟团队,参与豆包大模型的核心技术研发,适合具有大模型算法和工程经验的技术专家

最低要求

计算机相关专业本科及以上学历,具有一年及以上大模型算法工作经验,算法与工程能力兼备者优先

熟悉大模型强化学习系统,有OpenRLHF、VeRL使用和开发经验者优先
深入理解Post-Training全流程与核心算法,包括但不限于DPO,PPO,GRPO,Reward Modeling等
熟悉大规模分布式训练框架和分布式并行概念,如PyTorch FSDP2的原理与应用、DeviceMesh抽象、DTensor语义等
掌握高性能推理引擎(如vLLM,SGLang)的原理与优化方法(如Continuous Batching,PagedAttention,Prefix Caching)等
熟练掌握Python,至少熟练使用一种编译型语言(C/C++/Rust/Golang/Java等),拥有扎实的数据结构与算法功底,代码风格规范且高效
出色的分析和解决问题的能力
具备良好的自驱力和沟通协作能力,能和团队一起探索新技术,推动技术进步

工作职责

负责改进RL训练系统,包括基于Ray的RL Trainer功能拓展、Rollout/采样策略探索、Reward系统集成、Agent Loop复杂任务下轨迹管理等

负责大模型SFT/RL训练性能和稳定性优化,支持Reasoning,Agent,VLM等各类Post-Training任务
探索前沿大模型算法和训练技术,包括Off-Policy RL训练效果和效率、SRFT、OnPolicy Distillation等

AI 洞察

优缺点分析

优点

  • 字节跳动核心AI团队,豆包大模型是公司战略级产品,资源充足
  • 技术栈前沿,涵盖RL、分布式训练、高性能推理等热门领域,积累深厚
  • 与大牛共事,成长速度快,职业发展空间大
  • 工作强度较大,互联网大厂节奏快,需适应高强度研发
  • 技术难度高,需持续跟进学术界和工业界最新进展

缺点 / 挑战

  • 团队优秀,内部竞争压力较大
  • 适合热爱大模型技术、追求技术卓越、乐于接受挑战且自驱力强的算法工程师

角色解读

  • 深入大模型训练与强化学习领域,成为行业顶尖算法专家
  • 横向拓展至多模态、Agent等方向,参与前沿技术落地
  • 在字节跳动体系内晋升为技术Leader,带领团队探索下一代AI技术
  • 改进大模型强化学习训练系统,包括基于Ray的Trainer功能拓展和采样策略优化
  • 优化大模型SFT/RL训练的性能和稳定性,支持多种Post-Training任务
  • 探索前沿训练技术,如Off-Policy RL、SRFT、OnPolicy Distillation等
  • 精通大模型强化学习框架(如OpenRLHF、VeRL)和核心算法(PPO、GRPO等)
  • 熟悉大规模分布式训练(PyTorch FSDP2、DeviceMesh)和高性能推理引擎(vLLM、SGLang)
  • 扎实的编程能力(Python + 编译型语言)和算法功底

申请策略

  • 关注字节跳动技术博客和豆包模型动态,了解团队技术方向
  • 准备一个完整的项目案例,体现从算法到工程落地的能力
  • 突出大模型强化学习相关项目经历,尤其是RL训练系统优化或Post-Training实践
  • 强调分布式训练和推理优化经验,附上具体性能提升数据
  • 展示编程能力(Python和C++等)以及算法竞赛或开源贡献
  • 深入学习OpenRLHF、VeRL等强化学习框架原理
  • 实践vLLM、SGLang等推理引擎的优化技术
  • 补充分布式并行计算知识,如FSDP2、DeviceMesh

面试指南

  • 用STAR法则(情境-任务-行动-结果)结构化描述项目经验
  • 从原理到实践层层递进,先理论基础再具体实现
  • 突出对比和权衡,展示技术深度和系统思维
  • 请详细介绍一个你参与的大模型强化学习项目,包括系统架构和遇到的挑战
  • 如何优化RL训练中的采样效率?请结合具体技术方案
  • 解释一下PPO和GRPO的区别以及各自适用场景
  • 描述你使用PyTorch FSDP2进行分布式训练的经验,遇到过什么问题?
  • 如何看待Off-Policy RL在大模型训练中的前景?

匹配度报告

75
综合匹配度

大厂核心前沿算法岗,高成长高薪资,但工作强度大、WLB一般。

适合人群
适合以技术成长为核心动力、能接受高强度工作的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利80
成长发展95
工作生活40
使命价值85

薪资福利匹配

80较高

薪资水平在行业内具有竞争力,但JD未明确福利细节,参考字节惯例五险一金+补充医疗,综合补偿性较好。

薪资信号未披露(AI估算:30K-60K/月)

成长发展匹配

95较高

技术前沿性极强,涉及大模型强化学习、分布式训练等最新方向,成长空间巨大。

技术前沿前沿/新兴技术
技术栈大模型、强化学习、RL、SFT、PPO、GRPO、PyTorch、vLLM、Ray、分布式训练
业务类型profit_center

工作生活匹配

40较低

仅现场办公,未提及弹性工作制,互联网大厂通常有加班文化,生活平衡一般。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

85较高

AI大模型处于高速增长赛道,技术创新直接推动行业发展,社会价值较高。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 商家BD-抖音生活服务(常州)

    字节跳动 · 常州市
    AI 估算 · 8k-15k
  • 市场营销经理(汽车及泛高科技行业)-飞书

    字节跳动 · 上海市
    AI 估算 · 25k-40k
  • 巨量千川自助客户增长运营-抖音电商

    字节跳动 · 上海市
    AI 估算 · 25k-45k
  • 大客户销售(零售行业)-抖音生活服务(成都)

    字节跳动 · 成都市
    AI 估算 · 20k-40k
  • 高级C++开发工程师 - 飞书视频会议

    字节跳动 · 杭州市
    AI 估算 · 30k-50k

相似职位推荐

  • 广告算法工程师-【海外算法中心】

    快手 · 北京市
    AI 估算 · 30k-60k
  • 高级数据研发工程师-【可灵AI专项】

    快手 · 北京市
    AI 估算 · 30k-50k
  • Java技术专家(架构)-【商业化】

    快手 · 北京市
    AI 估算 · 50k-80k

字节跳动 的其他在招职位

  • 商家BD-抖音生活服务(常州)

    字节跳动 · 常州市
    AI 估算 · 8k-15k
  • 市场营销经理(汽车及泛高科技行业)-飞书

    字节跳动 · 上海市
    AI 估算 · 25k-40k
  • 巨量千川自助客户增长运营-抖音电商

    字节跳动 · 上海市
    AI 估算 · 25k-45k
  • 大客户销售(零售行业)-抖音生活服务(成都)

    字节跳动 · 成都市
    AI 估算 · 20k-40k
  • 高级C++开发工程师 - 飞书视频会议

    字节跳动 · 杭州市
    AI 估算 · 30k-50k

相似职位推荐

  • 广告算法工程师-【海外算法中心】

    快手 · 北京市
    AI 估算 · 30k-60k
  • 高级数据研发工程师-【可灵AI专项】

    快手 · 北京市
    AI 估算 · 30k-50k
  • Java技术专家(架构)-【商业化】

    快手 · 北京市
    AI 估算 · 50k-80k