Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
大模型训练框架开发工程师-抖音研发
立即应聘

大模型训练框架开发工程师-抖音研发

发布于 大约 7 小时前

普通员工/个人贡献者

北京市
中级经验
全职员工
仅现场办公
本科
GPU
PyTorch
性能优化
CUDA
NCCL
分布式训练
DeepSpeed
大模型训练
FSDP
Megatron

AI 估算 · 30k–60k

字节跳动核心研发岗,大模型方向技术稀缺,薪资竞争力强,综合市场对标给出范围。

职位详情

关于这个职位

该职位负责抖音大模型训练框架的研发与优化,包括分布式训练架构设计、GPU/NPU性能调优及容错机制构建

你将深度参与前沿AI基础设施的建设,解决百亿级参数模型训练中的技术难题
适合对大模型技术有热情、具备分布式系统经验的工程师

最低要求

计算机或相关专业背景,本科及以上学历

年以上深度学习或分布式训练相关经验
熟悉PyTorch/DeepSpeed/Megatron/MindSpore等训练框架原理与实现
深入理解多机多卡通信机制与并行策略(NCCL、HCCL、FSDP、TP、PP等)
具备GPU/NPU平台的性能调优经验,能识别并解决性能瓶颈
有较大尺寸模型(如32B+Dense或100B+MoE)训练经验者优先
具备良好的代码能力、系统分析能力与协作沟通能力

工作职责

设计与优化大模型的分布式训练架构,包括FSDP/ZeRO、TP、PP、EP、SP等策略

提升GPU/NPU平台的训练性能与资源利用率,优化通信、调度与内存使用
构建高可靠的训练管线(Checkpoint、混合精度、容错、Profiling等)
参与模型在不同硬件平台的适配与性能对齐
为模型团队提供训练支持、调优方案和工具链建设

优先资格

实战经验:完成过百卡级以上大模型训练任务

框架贡献:参与过Megatron-LM、DeepSpeed、ColossalAI、MindSpore等开源项目
系统优化:具备CUDA/C++/通信调度/算子优化能力

AI 洞察

优缺点分析

优点

  • 字节跳动平台资源丰富,有海量数据和算力支持,能快速推动技术落地
  • 团队技术氛围浓厚,与顶尖工程师协作,个人成长空间大
  • 大模型训练框架复杂度高,需同时掌握系统工程、分布式计算和深度学习知识,学习曲线陡峭
  • 技术迭代快,需要持续跟进社区最新进展,保持技术敏锐度
  • 适合对分布式系统和大模型技术有强烈兴趣,具备扎实的系统和工程能力,愿意在技术深度上持续精进的工程师

缺点 / 挑战

  • 身处大模型技术最前沿,接触并解决百亿参数级训练的真实挑战,技术积累含金量高
  • 业务压力大,可能面临紧急的模型训练优化需求,需要高强度投入

角色解读

  • 技术深耕:成为大模型训练框架领域的专家,主导下一代训练架构的设计
  • 横向拓展:向AI基础设施、MLOps或芯片适配方向延伸,或转型为AI系统架构师
  • 管理方向:在团队中承担技术负责人角色,带领小团队攻克复杂技术难题
  • 设计并优化大模型分布式训练架构,实现多种并行策略(FSDP、TP、PP等)以提升训练效率
  • 深入GPU/NPU平台进行性能调优,优化通信、调度与内存使用,提升资源利用率
  • 构建高可靠的训练管线,包括Checkpoint、混合精度、容错机制和Profiling工具
  • 为模型团队提供技术支持和工具链建设,协助解决训练中的疑难问题
  • 扎实的深度学习与分布式训练基础,熟悉PyTorch、DeepSpeed、Megatron等框架的实现原理
  • 深入理解多机多卡通信机制(NCCL、HCCL)和并行策略(FSDP、TP、PP等)
  • 具备GPU/NPU平台的性能调优经验,能通过Profiling定位并解决性能瓶颈
  • 优秀的代码能力和系统分析能力,具备协作沟通技巧

申请策略

  • 面试前深入了解抖音大模型业务方向(如推荐、搜索、AI创作),思考你的技术如何赋能业务
  • 准备一个完整的性能调优案例,从问题定位到方案实施、效果验证,展示系统化思维
  • 突出分布式训练相关项目经验,说明你负责的并行策略、性能优化成果及规模(如GPU数量、模型参数量)
  • 强调对PyTorch/DeepSpeed/Megatron等框架的深入理解,可附上代码贡献或优化案例
  • 展示性能调优能力,如通过通信优化或算子融合将训练效率提升的具体百分比
  • 若对某些并行策略(如EP、SP)不熟悉,可学习相关论文或源码,加深理解
  • 补充GPU/NPU底层知识,如CUDA编程、算子优化、通信拓扑等
  • 参与开源社区项目(如Megatron-LM、DeepSpeed),提交PR或Issue,增强实战经验

面试指南

  • 问题分析:先明确问题的现象和约束(如GPU型号、互联方式、模型结构),再定位可能瓶颈(通信、计算、内存)
  • 方案对比:列举可能的优化手段(如梯度累积、通信重叠、梯度压缩),说明原理和优缺点,结合场景给出推荐
  • 效果验证:通过Profiling工具(NCCL、nvprof)量化优化前后的性能指标,确保方案有效
  • 请解释FSDP与ZeRO的区别,以及各自适用场景
  • 在多机多卡训练中,如何分析通信瓶颈?你会采取哪些优化措施?
  • 描述一次你解决大规模训练性能问题的经历,包括问题现象、分析过程和最终方案
  • 你对Megatron-LM的并行策略有哪些理解?TP与PP如何选择?
  • 在大模型训练中,Checkpoint的保存和加载如何保证高效且一致?

匹配度报告

62
综合匹配度

字节大模型核心岗,前沿技术、高成长、高回报,但工作强度大、WLB较差。

适合人群
最适合追求技术深度与前沿挑战、以成长为核心驱动力的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利70
成长发展90
工作生活30
使命价值60

薪资福利匹配

70中等

薪资面议但字节跳动研发岗通常处于行业75分位以上,福利完善,但JD未提及具体数字,因此得分中等偏上。

薪资信号面议 (30K-60K/月)

成长发展匹配

90较高

职位聚焦大模型前沿技术,属于AI核心领域,技术栈新且挑战大,成长空间极高。

技术前沿前沿/新兴技术
技术栈大模型、分布式训练、FSDP、ZeRO、TP、PP、EP、SP、NCCL、HCCL、GPU、NPU、CUDA、DeepSpeed、Megatron
业务类型profit_center

工作生活匹配

30较低

仅现场办公,字节跳动工作强度较高,JD未提及弹性或WLB,对生活化动机满足度低。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

60中等

大模型行业高速增长,但职位偏底层技术,社会影响力间接,创新水平高但未直接体现使命。

行业发展高速增长赛道
社会影响中性/一般
创新程度开拓性创新(行业首创)
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 光学模组专家(变焦透镜)-PICO

    字节跳动 · 上海市
    AI 估算 · 35k-60k
  • AI应用策略运营(人工服务方向)-体验与服务

    字节跳动 · 北京市
    AI 估算 · 20k-40k
  • 高级产品经理-地理位置中台(北京/上海/深圳)

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 大数据研发工程师 — 实验评估方向

    字节跳动 · 北京市
    AI 估算 · 25k-50k
  • 机器人业务系统后端工程师-Seed

    字节跳动 · 北京市
    AI 估算 · 25k-45k

字节跳动 的其他在招职位

  • 光学模组专家(变焦透镜)-PICO

    字节跳动 · 上海市
    AI 估算 · 35k-60k
  • AI应用策略运营(人工服务方向)-体验与服务

    字节跳动 · 北京市
    AI 估算 · 20k-40k
  • 高级产品经理-地理位置中台(北京/上海/深圳)

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 大数据研发工程师 — 实验评估方向

    字节跳动 · 北京市
    AI 估算 · 25k-50k
  • 机器人业务系统后端工程师-Seed

    字节跳动 · 北京市
    AI 估算 · 25k-45k