字节跳动的多模态大模型训练加速工程师-Data AML(北京/上海/杭州/深圳)薪资是多少？

该职位薪资范围为 25k–45k（人民币/月）。

多模态大模型训练加速工程师-Data AML(北京/上海/杭州/深圳)的工作地点在哪里？

该职位工作地点位于上海市。工作形式为仅现场办公。

字节跳动的多模态大模型训练加速工程师-Data AML(北京/上海/杭州/深圳)有什么任职要求？

该职位要求学历未注明学历及高级经验工作经验。

字节跳动

多模态大模型训练加速工程师-Data AML(北京/上海/杭州/深圳)

立即应聘

多模态大模型训练加速工程师-Data AML(北京/上海/杭州/深圳)

发布于大约 2 个月前

普通员工/个人贡献者

上海市

高级经验

全职员工

仅现场办公

学历未注明

软件工程

PyTorch

分布式训练

AIGC

DeepSpeed

多模态大模型

Megatron

Zero

低精度训练

训练加速

AI 估算 · 25k–45k

涉及前沿多模态大模型训练加速，技术门槛高，字节薪资竞争力强。

职位详情

关于这个职位

该职位负责多模态大模型的训练加速，涉及SFT、RL等后训练任务，以及异构卡适配

需要深入理解分布式训练和AIGC模型原理，熟练使用PyTorch、Megatron等框架

适合对AI训练加速有热情的高级工程师

最低要求

有AI工程系统优化经验，深入理解计算机体系结构、熟悉视觉大模型的原理与分布式训练方法

工作职责

负责视频生成/图像生成/多模态等方向模型后训练加速，如SFT、RL、CT、LoRA任务的训练加速

负责Seedance/Seedream模型训练的异构卡适配工作

优先资格

了解主流AIGC、多模态算法模型原理，有AIGC模型训练适配和加速经验优先

熟悉PyTorch、Megatron、DeepSpeed等训练框架原理，与ZeRO、TP、SP等并行技术原理优先

熟悉Gradient Checkpoint、Activation Offloading、通算融合、同算掩盖、低精度训练等加速技巧优先

熟悉Triton、TileLang、Cute DSL等语言并具备相关技术优化经验，或熟悉Verl、OpenRLHF、TRL优先

AI 洞察

优缺点分析

优点

字节跳动平台资源丰富，技术氛围浓厚，能接触前沿多模态大模型训练
从事高难度加速任务，技术积累深厚，薪资待遇优厚
发展空间大，可快速成长为领域专家
技术复杂度高，需持续学习和跟进最新进展

缺点 / 挑战

工作强度可能较大，需应对训练任务稳定性和效率挑战
适合对AI训练加速有强烈热情、技术功底扎实、不惧挑战的高级工程师

角色解读

成为大模型训练加速专家，引领行业技术发展
转向AI系统架构师，设计高效分布式训练平台
晋升为技术负责人或技术管理岗位，带领团队攻克难题
负责视频生成/图像生成等模型的SFT、RL等后训练加速任务，提升训练效率
进行异构卡适配工作，确保模型在不同硬件上高效运行
探索和实施Gradient Checkpoint、低精度训练等加速技巧，优化训练流程
深入理解计算机体系结构和分布式训练原理，熟悉视觉大模型原理
精通PyTorch、Megatron、DeepSpeed等训练框架，掌握ZeRO、TP等并行技术
了解AIGC和多模态模型，有模型训练适配和加速经验优先

申请策略

准备一个关于训练加速的技术分享或开源项目
了解字节Seedance/Seedream模型方向，体现对业务的理解
突出分布式训练、模型加速方面的项目经验，量化优化成果
展示对PyTorch、Megatron等框架的深度优化案例
强调对AIGC模型的理解和动手能力，注明相关开源贡献
学习Triton、TileLang等DSL语言，提升底层优化能力
了解Verl、OpenRLHF等强化学习框架，扩展技术广度

面试指南

从系统层面分析问题，结合硬件特性和算法特点提出方案
结合实际项目案例，用数据量化优化效果，强调解决问题的方法
对于对比类问题，从性能、易用性、扩展性等多维度分析
如何优化大规模分布式训练中的通信瓶颈？
描述Gradient Checkpoint的实现原理和应用场景
在视频生成模型训练中，如何处理异构卡适配？
对比ZeRO和TP的优缺点，并说明适用场景
你参与过哪些AIGC模型的加速项目？具体如何优化的？

职位点评

综合评分

字节跳动多模态大模型训练加速岗，薪资优厚、技术前沿，但工作强度大。

更适合这类人

适合追求技术成长、不介意工作强度的求职者。

表现最好

成长发展

相对薄弱

工作生活

薪资福利85

成长发展90

工作生活50

使命价值75

薪资福利

85较高

字节跳动薪资待遇具竞争力，但工作强度较大。

薪资信号偏高 (25K-45K/月)

成长发展

90较高

涉及多模态大模型训练加速，技术前沿，可快速积累核心竞争力。

技术前沿前沿/新兴技术

技术栈多模态、大模型、训练加速、PyTorch、Megatron、DeepSpeed、AIGC、分布式训练

业务类型ambiguous

工作生活

50较低

办公地点上海，需现场办公，未提及弹性工作，互联网大厂通常加班较多。

工作模式仅现场办公

办公地点未明确

加班情况未提及（无法判断）

使命价值

75中等

多模态生成技术处于AI前沿，社会影响中性偏正。

行业发展高速增长赛道

社会影响中性/一般

创新程度积极采用新技术

Watch Jobs

字节跳动

多模态大模型训练加速工程师-Data AML(北京/上海/杭州/深圳)

立即应聘

多模态大模型训练加速工程师-Data AML(北京/上海/杭州/深圳)

发布于大约 2 个月前

普通员工/个人贡献者

上海市

高级经验

全职员工

仅现场办公

学历未注明

软件工程

PyTorch

分布式训练

AIGC

DeepSpeed

多模态大模型

Megatron

Zero

低精度训练

训练加速

AI 估算 · 25k–45k

涉及前沿多模态大模型训练加速，技术门槛高，字节薪资竞争力强。

职位详情

关于这个职位

该职位负责多模态大模型的训练加速，涉及SFT、RL等后训练任务，以及异构卡适配

需要深入理解分布式训练和AIGC模型原理，熟练使用PyTorch、Megatron等框架

适合对AI训练加速有热情的高级工程师

最低要求

有AI工程系统优化经验，深入理解计算机体系结构、熟悉视觉大模型的原理与分布式训练方法

工作职责

负责视频生成/图像生成/多模态等方向模型后训练加速，如SFT、RL、CT、LoRA任务的训练加速

负责Seedance/Seedream模型训练的异构卡适配工作

优先资格

了解主流AIGC、多模态算法模型原理，有AIGC模型训练适配和加速经验优先

熟悉PyTorch、Megatron、DeepSpeed等训练框架原理，与ZeRO、TP、SP等并行技术原理优先

熟悉Gradient Checkpoint、Activation Offloading、通算融合、同算掩盖、低精度训练等加速技巧优先

熟悉Triton、TileLang、Cute DSL等语言并具备相关技术优化经验，或熟悉Verl、OpenRLHF、TRL优先

AI 洞察

优缺点分析

优点

字节跳动平台资源丰富，技术氛围浓厚，能接触前沿多模态大模型训练
从事高难度加速任务，技术积累深厚，薪资待遇优厚
发展空间大，可快速成长为领域专家
技术复杂度高，需持续学习和跟进最新进展

缺点 / 挑战

工作强度可能较大，需应对训练任务稳定性和效率挑战
适合对AI训练加速有强烈热情、技术功底扎实、不惧挑战的高级工程师

角色解读

成为大模型训练加速专家，引领行业技术发展
转向AI系统架构师，设计高效分布式训练平台
晋升为技术负责人或技术管理岗位，带领团队攻克难题
负责视频生成/图像生成等模型的SFT、RL等后训练加速任务，提升训练效率
进行异构卡适配工作，确保模型在不同硬件上高效运行
探索和实施Gradient Checkpoint、低精度训练等加速技巧，优化训练流程
深入理解计算机体系结构和分布式训练原理，熟悉视觉大模型原理
精通PyTorch、Megatron、DeepSpeed等训练框架，掌握ZeRO、TP等并行技术
了解AIGC和多模态模型，有模型训练适配和加速经验优先

申请策略

准备一个关于训练加速的技术分享或开源项目
了解字节Seedance/Seedream模型方向，体现对业务的理解
突出分布式训练、模型加速方面的项目经验，量化优化成果
展示对PyTorch、Megatron等框架的深度优化案例
强调对AIGC模型的理解和动手能力，注明相关开源贡献
学习Triton、TileLang等DSL语言，提升底层优化能力
了解Verl、OpenRLHF等强化学习框架，扩展技术广度

面试指南

从系统层面分析问题，结合硬件特性和算法特点提出方案
结合实际项目案例，用数据量化优化效果，强调解决问题的方法
对于对比类问题，从性能、易用性、扩展性等多维度分析
如何优化大规模分布式训练中的通信瓶颈？
描述Gradient Checkpoint的实现原理和应用场景
在视频生成模型训练中，如何处理异构卡适配？
对比ZeRO和TP的优缺点，并说明适用场景
你参与过哪些AIGC模型的加速项目？具体如何优化的？

职位点评

综合评分

字节跳动多模态大模型训练加速岗，薪资优厚、技术前沿，但工作强度大。

更适合这类人

适合追求技术成长、不介意工作强度的求职者。

表现最好

成长发展

相对薄弱

工作生活

薪资福利85

成长发展90

工作生活50

使命价值75

薪资福利

85较高

字节跳动薪资待遇具竞争力，但工作强度较大。

薪资信号偏高 (25K-45K/月)

成长发展

90较高

涉及多模态大模型训练加速，技术前沿，可快速积累核心竞争力。

技术前沿前沿/新兴技术

技术栈多模态、大模型、训练加速、PyTorch、Megatron、DeepSpeed、AIGC、分布式训练

业务类型ambiguous

工作生活

50较低

办公地点上海，需现场办公，未提及弹性工作，互联网大厂通常加班较多。

工作模式仅现场办公

办公地点未明确

加班情况未提及（无法判断）

使命价值

75中等

多模态生成技术处于AI前沿，社会影响中性偏正。

行业发展高速增长赛道

社会影响中性/一般

创新程度积极采用新技术

Watch Jobs

多模态大模型训练加速工程师-Data AML(北京/上海/杭州/深圳)

职位详情

关于这个职位

最低要求

工作职责

优先资格

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

多模态大模型训练加速工程师-Data AML(北京/上海/杭州/深圳)

职位详情

关于这个职位

最低要求

工作职责

优先资格

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

字节跳动 的其他在招职位

后端研发工程师-电商交易

原型验证工程师-Data（深圳）

硬件加速推理引擎运行时开发工程师-AI工具链

后台开发工程师-抖音用户体验

分类值班号-CQC

相似职位推荐

Backend Developer - AI & Agentic Applications

Data Engineer

（高级）安卓应用开发工程师

Specialist, ML Engineer

VP, Engineering Lead, AI Wealth

字节跳动 的其他在招职位

后端研发工程师-电商交易

原型验证工程师-Data（深圳）

硬件加速推理引擎运行时开发工程师-AI工具链

后台开发工程师-抖音用户体验

分类值班号-CQC

相似职位推荐

Backend Developer - AI & Agentic Applications

Data Engineer

（高级）安卓应用开发工程师

Specialist, ML Engineer

VP, Engineering Lead, AI Wealth

字节跳动的其他在招职位

字节跳动的其他在招职位