Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
大模型训练系统与优化工程师(VLM/Agent RL方向)-Data
立即应聘

大模型训练系统与优化工程师(VLM/Agent RL方向)-Data

发布于 1 天前

普通员工/个人贡献者

上海市
中级经验
全职员工
仅现场办公
本科
PyTorch
强化学习
分布式训练
VLM
大模型
DeepSpeed
MoE
FSDP
Megatron
Agent Rl

AI 估算 · 40k–70k

大厂高级工程师,上海,大模型核心岗位,薪资竞争力强,技术难度高

职位详情

关于这个职位

该职位负责大模型Post-training训练框架的架构演进与优化,专注于超大规模分布式训练、Agent RL框架构建以及多模态支持

你将与顶尖团队合作,解决千亿级模型训练的性能与稳定性挑战,适合对AI基础设施有热情的技术专家

最低要求

具备2年以上机器学习系统设计、开发与性能调优经验,熟练掌握Python与C++

深入理解并具备PyTorch、DeepSpeed、Megatron或FSDP等主流分布式训练框架的二次开发经验
有100B以上超大模型分布式训练实战经验,能够独立排查并解决收敛性问题与分布式训练瓶颈
具备工程素养,对提升AI Infra的研发效率、代码整洁度与系统稳定性有追求

工作职责

统一训练架构建设与演进:负责大模型Post-training框架的代码抽象与底层重构,兼容不同模态、不同训练方式的、正确的、高效的训练框架的建设

超大规模分布式训练优化:面向100B~1T参数级别的超大模型,探索并落地极致的分布式训练策略(DP/TP/PP/EP等组合),通过算子融合、显存优化、分布式策略调整等手段大幅提升集群训练的MFU
Agent RL框架与评估底座建设:攻坚Reasoning RL/Agent RL的训练框架,构建适用于复杂业务环境的标准化评测基准与标准的、稳定的Harness,解决千亿模型在RL阶段的稳定收敛与Rollout效率问题,解决在Agent RL下的长尾问题
多模态与新架构支持:为MoE、Linear Attention等新型模型结构,以及多模态(图、文、音、视)复杂模态的模型训练提供高效支持与正确性(Convergence)验证

优先资格

在强化学习训练框架(PPO/GRPO/Agent RL)或大模型评测底座、Agentic Harness有深度实践者优先

AI 洞察

优缺点分析

优点

  • 深度参与大模型核心技术栈,技术前沿性强,积累宝贵的分布式训练经验
  • 团队技术氛围浓厚,与顶级工程师合作,成长速度快
  • 涉及底层系统优化,问题定位和解决难度高,需要强大的工程能力和耐心
  • 技术迭代迅速,需要持续跟踪前沿论文和开源项目

缺点 / 挑战

  • 字节跳动平台资源丰富,算力和数据支持充足,能够挑战业界顶尖规模模型
  • 工作强度较大,可能面临较高压力和持续学习要求
  • 适合对大规模分布式系统有强烈兴趣、具备扎实工程能力、渴望挑战技术深度的AI工程师

角色解读

  • 成为大模型训练系统方向的专家,主导训练框架的架构演进
  • 向AI基础设施(AI Infra)技术负责人发展,管理团队并推动技术策略
  • 横向拓展到多模态、Agent等前沿领域,提升综合技术影响力
  • 设计和优化大模型Post-training训练框架,进行代码抽象与底层重构,支持多种模态和训练方式
  • 针对百亿至万亿参数模型,探索极致的分布式训练策略,通过算子融合、显存优化等手段提升训练效率
  • 构建强化学习(RL)训练框架,解决Agent RL场景下的稳定性、收敛性和长尾问题,并建立标准化评测基准
  • 支持MoE、Linear Attention等新型架构以及多模态模型的训练,确保正确性和高效性
  • 精通Python和C++,具备2年以上机器学习系统设计与性能调优经验
  • 深入理解PyTorch、DeepSpeed、Megatron或FSDP等分布式框架,并有二次开发经验
  • 有100B以上超大模型分布式训练实战经验,能独立排查训练问题
  • 熟悉强化学习训练框架(PPO/GRPO/Agent RL)或评测底座者优先

申请策略

  • 准备一个完整的项目案例,能清晰讲解从问题定义到优化方案再到效果验证的全过程
  • 关注字节跳动的AI技术博客或公开演讲,展现你对公司技术方向的兴趣
  • 突出分布式训练相关的项目经验,尤其是百亿参数以上模型的实战经历
  • 强调PyTorch、DeepSpeed等框架的二次开发或性能优化成果
  • 如有RL训练框架或评测底座经验,务必重点展示
  • 列举具体的性能提升指标(如MFU提升、训练收敛速度等)
  • 补充强化学习(PPO/GRPO)和Agent相关技术知识,了解主流RL框架
  • 熟悉最新的分布式训练策略(如EP、序列并行)和编译器技术(如Triton)

面试指南

  • 对于系统优化问题,遵循“问题分析 → 瓶颈定位 → 方案设计 → 实验验证 → 迭代优化”的框架
  • 对于算法理解问题,先阐述基本原理,再结合实践案例说明应用场景和trade-off
  • 对于设计问题,从目标出发,考虑约束条件(算力、带宽、数据),给出分层解决方案
  • 请详细描述你参与过的一个分布式训练优化案例,包括使用的策略和取得的收益
  • 如何诊断和解决大模型训练中的收敛性问题?请举例说明
  • 对比PPO和GRPO的优缺点,在Agent RL场景下你更推荐哪种?
  • 如果部署一个千亿参数模型在256张GPU上,你会如何设计分布式策略?
  • 谈谈你对MoE模型训练中负载均衡的理解和优化方法

匹配度报告

72
综合匹配度

大厂核心AI Infra岗位,技术前沿,薪资优厚,但工作强度大,WLB较差。

适合人群
最适合追求技术成长和前沿领域探索的求职者,愿意接受较高工作强度以换取职业跃升。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利75
成长发展95
工作生活40
使命价值80

薪资福利匹配

75中等

该职位薪资较高,福利优厚(五险一金、补充医疗等),但未明确具体薪资,属于大厂标准水平。

薪资信号面议 (40K-70K/月)

成长发展匹配

95较高

技术栈极其前沿(大模型、RL、多模态),团队实力强,有大量成长空间和内部培训机会,但JD未明确提及晋升通道。

技术前沿前沿/新兴技术
技术栈大模型、分布式训练、强化学习、Agent RL、VLM、MoE
业务类型ambiguous

工作生活匹配

40较低

字节跳动工作强度较大,上海办公室通常要求现场办公,WLB较差,但地点在市中心?未明确。

工作模式仅现场办公
办公地点未明确
加班情况JD含高强度暗示词

使命价值匹配

80较高

大模型处于高速增长赛道,对AI基础设施有重要社会影响力,但使命导向不明。

行业发展高速增长赛道
社会影响中性/一般
创新程度开拓性创新(行业首创)
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • AI平台研发工程师-集团信息系统

    字节跳动 · 深圳市
    AI 估算 · 25k-45k
  • 国际业务内容商务拓展专家-Dola

    字节跳动 · 北京市
    AI 估算 · 35k-65k
  • 商业化营销策略专家-抖音生活服务

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • HRBP-中国公共职能(北京)

    字节跳动 · 北京市
    AI 估算 · 20k-30k
  • 产品经理(导航/路线/路况)-地理位置中台

    字节跳动 · 北京市
    AI 估算 · 25k-40k

相似职位推荐

  • 开发工程师

    中国移动 · 贵阳市
    AI 估算 · 12k-20k
  • Dots-【Ace顶尖实习生】Long Horizon Agentic Task 能力提升研究

    小红书 · 北京市
    AI 估算 · 4k-8k

字节跳动 的其他在招职位

  • AI平台研发工程师-集团信息系统

    字节跳动 · 深圳市
    AI 估算 · 25k-45k
  • 国际业务内容商务拓展专家-Dola

    字节跳动 · 北京市
    AI 估算 · 35k-65k
  • 商业化营销策略专家-抖音生活服务

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • HRBP-中国公共职能(北京)

    字节跳动 · 北京市
    AI 估算 · 20k-30k
  • 产品经理(导航/路线/路况)-地理位置中台

    字节跳动 · 北京市
    AI 估算 · 25k-40k

相似职位推荐

  • 开发工程师

    中国移动 · 贵阳市
    AI 估算 · 12k-20k
  • Dots-【Ace顶尖实习生】Long Horizon Agentic Task 能力提升研究

    小红书 · 北京市
    AI 估算 · 4k-8k