Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
多模态大模型训练加速工程师-Data AML(北京/上海/杭州/深圳)
立即应聘

多模态大模型训练加速工程师-Data AML(北京/上海/杭州/深圳)

发布于 大约 13 小时前

普通员工/个人贡献者

上海市
高级经验
全职员工
仅现场办公
学历未注明
PyTorch
分布式训练
AIGC
DeepSpeed
多模态大模型
Megatron
Zero
低精度训练
训练加速

AI 估算 · 25k–45k

涉及前沿多模态大模型训练加速,技术门槛高,字节薪资竞争力强。

职位详情

关于这个职位

该职位负责多模态大模型的训练加速,涉及SFT、RL等后训练任务,以及异构卡适配

需要深入理解分布式训练和AIGC模型原理,熟练使用PyTorch、Megatron等框架
适合对AI训练加速有热情的高级工程师

最低要求

有AI工程系统优化经验,深入理解计算机体系结构、熟悉视觉大模型的原理与分布式训练方法

工作职责

负责视频生成/图像生成/多模态等方向模型后训练加速,如SFT、RL、CT、LoRA任务的训练加速

负责Seedance/Seedream模型训练的异构卡适配工作

优先资格

了解主流AIGC、多模态算法模型原理,有AIGC模型训练适配和加速经验优先

熟悉PyTorch、Megatron、DeepSpeed等训练框架原理,与ZeRO、TP、SP等并行技术原理优先
熟悉Gradient Checkpoint、Activation Offloading、通算融合、同算掩盖、低精度训练等加速技巧优先
熟悉Triton、TileLang、Cute DSL等语言并具备相关技术优化经验,或熟悉Verl、OpenRLHF、TRL优先

AI 洞察

优缺点分析

优点

  • 字节跳动平台资源丰富,技术氛围浓厚,能接触前沿多模态大模型训练
  • 从事高难度加速任务,技术积累深厚,薪资待遇优厚
  • 发展空间大,可快速成长为领域专家
  • 技术复杂度高,需持续学习和跟进最新进展

缺点 / 挑战

  • 工作强度可能较大,需应对训练任务稳定性和效率挑战
  • 适合对AI训练加速有强烈热情、技术功底扎实、不惧挑战的高级工程师

角色解读

  • 成为大模型训练加速专家,引领行业技术发展
  • 转向AI系统架构师,设计高效分布式训练平台
  • 晋升为技术负责人或技术管理岗位,带领团队攻克难题
  • 负责视频生成/图像生成等模型的SFT、RL等后训练加速任务,提升训练效率
  • 进行异构卡适配工作,确保模型在不同硬件上高效运行
  • 探索和实施Gradient Checkpoint、低精度训练等加速技巧,优化训练流程
  • 深入理解计算机体系结构和分布式训练原理,熟悉视觉大模型原理
  • 精通PyTorch、Megatron、DeepSpeed等训练框架,掌握ZeRO、TP等并行技术
  • 了解AIGC和多模态模型,有模型训练适配和加速经验优先

申请策略

  • 准备一个关于训练加速的技术分享或开源项目
  • 了解字节Seedance/Seedream模型方向,体现对业务的理解
  • 突出分布式训练、模型加速方面的项目经验,量化优化成果
  • 展示对PyTorch、Megatron等框架的深度优化案例
  • 强调对AIGC模型的理解和动手能力,注明相关开源贡献
  • 学习Triton、TileLang等DSL语言,提升底层优化能力
  • 了解Verl、OpenRLHF等强化学习框架,扩展技术广度

面试指南

  • 从系统层面分析问题,结合硬件特性和算法特点提出方案
  • 结合实际项目案例,用数据量化优化效果,强调解决问题的方法
  • 对于对比类问题,从性能、易用性、扩展性等多维度分析
  • 如何优化大规模分布式训练中的通信瓶颈?
  • 描述Gradient Checkpoint的实现原理和应用场景
  • 在视频生成模型训练中,如何处理异构卡适配?
  • 对比ZeRO和TP的优缺点,并说明适用场景
  • 你参与过哪些AIGC模型的加速项目?具体如何优化的?

匹配度报告

75
综合匹配度

字节跳动多模态大模型训练加速岗,薪资优厚、技术前沿,但工作强度大。

适合人群
适合追求技术成长、不介意工作强度的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展90
工作生活50
使命价值75

薪资福利匹配

85较高

字节跳动薪资待遇具竞争力,但工作强度较大。

薪资信号偏高 (25K-45K/月)

成长发展匹配

90较高

涉及多模态大模型训练加速,技术前沿,可快速积累核心竞争力。

技术前沿前沿/新兴技术
技术栈多模态、大模型、训练加速、PyTorch、Megatron、DeepSpeed、AIGC、分布式训练
业务类型ambiguous

工作生活匹配

50较低

办公地点上海,需现场办公,未提及弹性工作,互联网大厂通常加班较多。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值匹配

75中等

多模态生成技术处于AI前沿,社会影响中性偏正。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • BDM-抖音生活服务(北京)

    字节跳动 · 北京市
    AI 估算 · 25k-35k
  • 大数据开发工程师-安全数仓

    字节跳动 · 北京市
    AI 估算 · 30k-50k
  • 高级游戏SDK客户端开发工程师-绿洲

    字节跳动 · 北京市
    AI 估算 · 30k-50k
  • 策略算法工程师-抖音直播

    字节跳动 · 北京市
    AI 估算 · 30k-60k
  • 大客户广告销售-母婴宠物行业

    字节跳动 · 杭州市
    AI 估算 · 15k-30k

相似职位推荐

  • 高级客户端开发工程师(AFK Journey)

    莉莉丝 · 上海市
    AI 估算 · 25k-40k
  • 用户增长算法工程师

    中国平安 · 深圳市
    AI 估算 · 30k-50k
  • MVA LLM Developer

    奔驰 · 北京市
    AI 估算 · 30k-60k
  • 前端开发实习生(27届)

    知乎 · 北京市
    AI 估算 · 4k-7k
  • Android开发实习生(27届)

    知乎 · 北京市
    AI 估算 · 4k-8k

字节跳动 的其他在招职位

  • BDM-抖音生活服务(北京)

    字节跳动 · 北京市
    AI 估算 · 25k-35k
  • 大数据开发工程师-安全数仓

    字节跳动 · 北京市
    AI 估算 · 30k-50k
  • 高级游戏SDK客户端开发工程师-绿洲

    字节跳动 · 北京市
    AI 估算 · 30k-50k
  • 策略算法工程师-抖音直播

    字节跳动 · 北京市
    AI 估算 · 30k-60k
  • 大客户广告销售-母婴宠物行业

    字节跳动 · 杭州市
    AI 估算 · 15k-30k

相似职位推荐

  • 高级客户端开发工程师(AFK Journey)

    莉莉丝 · 上海市
    AI 估算 · 25k-40k
  • 用户增长算法工程师

    中国平安 · 深圳市
    AI 估算 · 30k-50k
  • MVA LLM Developer

    奔驰 · 北京市
    AI 估算 · 30k-60k
  • 前端开发实习生(27届)

    知乎 · 北京市
    AI 估算 · 4k-7k
  • Android开发实习生(27届)

    知乎 · 北京市
    AI 估算 · 4k-8k