Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
训练性能优化专家-计算
立即应聘

训练性能优化专家-计算

发布于 大约 4 小时前

普通员工/个人贡献者

西安市
高级经验
全职员工
仅现场办公
学历未注明
GPU
PyTorch
TensorFlow
RDMA
AI芯片
分布式训练
DeepSpeed
混合精度训练
Bev感知
稀疏化

AI 估算 · 35k–55k

高级AI优化专家,字节跳动西安核心团队,技术壁垒高,薪资具备竞争力

职位详情

关于这个职位

该职位负责智能驾驶全栈模型的训练性能优化,包括混合精度训练、梯度压缩和集群分布式优化

你将主导PB级多传感器数据的训练加速,解决通信瓶颈与硬件适配问题,为智驾模型迭代提供高效算力支撑
适合具有扎实AI工程经验和集群优化背景的高级技术专家

最低要求

年以上AI领域实战经验,3年以上智能驾驶服务器端训练优化经验,主导过工业级集群训练项目,有可验证成果

精通C++/Python高性能编程,深入理解PyTorch/TensorFlow内核与分布式训练逻辑(DDP/DeepSpeed ZeRO),具备神经网络优化、并行计算、多模态数据处理基础
熟悉BEV感知/3D检测等模型训练原理
至少深耕任一方向:智能驾驶模型量化/稀疏化/梯度压缩及端到端集群训练优化,或集群架构设计/RDMA优化/混合并行策略/海量数据传输优化,或核心算子开发/TVM编译优化/服务器芯片指令集适配
了解主流服务器AI硬件架构与指令集,熟练运用PyTorch Profiler/NVIDIA Nsight/国产Profiling工具等集群诊断工具,具备全链路瓶颈定位能力

工作职责

模型训练优化:主导智能驾驶全栈模型(感知/BEV融合/预测/规划)服务器端训练优化,落地混合精度训练、结构化稀疏化、梯度压缩技术,平衡模型精度、训练效率与服务器资源开销

构建训练性能基准体系与自动化调优/测试管线,支撑规模化训练迭代
集群分布式优化:攻坚自动驾驶PB级多传感器数据的集群分布式训练,优化跨节点RDMA/TCP通信、低延迟序列化与动态拓扑
适配GPU/国产AI芯片集群,通过数据分片、混合并行(数据+模型+张量+流水线)、通信-计算重叠,突破传输瓶颈,保障训练稳定性

AI 洞察

优缺点分析

优点

  • 前沿技术栈:涉及混合精度、稀疏化、RDMA等顶尖AI基础设施技术
  • 高影响力:优化直接加速自动驾驶模型迭代,业务价值显著
  • 大厂平台:字节跳动提供海量算力资源和算法场景
  • 技术难度高:需精通分布式系统与AI训练,同时应对国产芯片适配的复杂性
  • 工作强度大:自动驾驶业务节奏快,优化迭代周期短

缺点 / 挑战

  • 适合热爱底层性能优化、有深厚分布式训练经验的技术专家,喜欢挑战大规模系统瓶颈

角色解读

  • 技术深耕:成为AI训练优化领域专家,主导更大规模集群与前沿算法落地
  • 横向扩展:向芯片适配、编译器设计或自动驾驶全栈架构发展
  • 管理路径:带领优化团队,负责训练平台架构与效率提升
  • 主导智能驾驶模型的训练性能优化,包括混合精度训练、稀疏化、梯度压缩等技术落地,平衡精度与效率
  • 攻坚PB级多传感器数据的集群分布式训练,优化通信拓扑与并行策略,突破传输瓶颈
  • 构建自动化性能基准与调优管线,支撑规模化训练迭代,并适配GPU/国产AI芯片
  • 精通C++/Python高性能编程,深入理解PyTorch/TensorFlow分布式训练内核(DDP/DeepSpeed)
  • 熟悉智能驾驶模型(如BEV感知、3D检测)原理及训练优化方法
  • 掌握集群架构、RDMA通信优化或TVM编译优化等至少一个方向
  • 熟练使用Profiling工具定位全链路性能瓶颈

申请策略

  • 准备一个完整的集群优化案例,从问题分析到解决方案及最终效果
  • 关注字节跳动自动驾驶团队的技术博客,了解其技术栈与挑战
  • 突出工业级集群训练项目的成果,如提速百分比、资源节省等量化数据
  • 强调对PyTorch/TensorFlow分布式训练的深入理解及实际调优经验
  • 展示在智能驾驶模型(如BEV)训练优化方面的具体工作
  • 补充RDMA通信优化或TVM编译优化等细分方向知识
  • 熟悉国产AI芯片(如华为昇腾、寒武纪)的架构与Profiling工具

面试指南

  • 用STAR法则:背景、任务、行动、结果,突出量化优化效果
  • 技术问题先阐述原理,再结合项目经验给出具体策略
  • 开放性问题上展示系统思维:从硬件、算法、通信、并行等多维度分析
  • 请描述一次你主导的分布式训练优化项目,如何平衡精度与效率?
  • RDMA与传统TCP在训练通信中的差异?如何减少同步开销?
  • 混合精度训练中如何处理精度损失?如何选择精度策略?
  • 如果训练任务在国产芯片上性能不佳,你会如何排查与优化?
  • DeepSpeed ZeRO的三个阶段原理及适用场景?

匹配度报告

79
综合匹配度

前沿AI训练优化,技术成长高,薪资优厚,但工作强度大且需现场办公。

适合人群
适合高度追求技术成长的求职者,愿意投入高强度工作以换取顶尖技术积累与高回报。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展90
工作生活60
使命价值80

薪资福利匹配

85较高

字节跳动薪资具备竞争力,西安地区高级专家待遇优厚,但JD未明确福利。

薪资信号未披露(AI估算:35K-55K/月)

成长发展匹配

90较高

技术前沿,涉及分布式、AI芯片、编译器等高成长领域,有较大技术发展空间。

技术前沿前沿/新兴技术
技术栈混合精度训练、稀疏化、RDMA、DeepSpeed、TVM、国产AI芯片
业务类型profit_center

工作生活匹配

60中等

仅现场办公,未提及弹性或远程,自动驾驶业务压力较大,WLB中等偏弱。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值匹配

80较高

自动驾驶是高速增长赛道,技术对社会有正向影响,但JD未强调使命。

行业发展高速增长赛道
社会影响正向社会影响力较高
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 资深研发工程师(互动方向)-国际化内容安全平台

    字节跳动 · 北京市
    AI 估算 · 35k-55k
  • 平台产品营销经理-国际化广告商业平台

    字节跳动 · 深圳市
    AI 估算 · 30k-50k
  • 大语言模型通用Agent研究工程师-Seed

    字节跳动 · 北京市
    AI 估算 · 30k-60k
  • 推荐算法工程师(多端电商)-抖音电商

    字节跳动 · 杭州市
    AI 估算 · 35k-65k
  • 国际战略专家-TikTok Shop

    字节跳动 · 北京市
    AI 估算 · 25k-40k

相似职位推荐

  • 昆仑芯-芯片研发实习生(J83484)

    百度 · 北京市
    AI 估算 · 6k-10k
  • 广告算法工程师实习生(J97403)

    百度 · 上海市
    AI 估算 · 5k-8k
  • 生态研发组_实习PNC规控算法工程师(J71278)

    百度 · 北京市
    AI 估算 · 4k-8k
  • 推荐策略实习生(J72891)

    百度 · 北京市
    AI 估算 · 5k-8k
  • 大模型/多模态算法工程师(J94551)

    百度 · 北京市
    AI 估算 · 30k-50k

字节跳动 的其他在招职位

  • 资深研发工程师(互动方向)-国际化内容安全平台

    字节跳动 · 北京市
    AI 估算 · 35k-55k
  • 平台产品营销经理-国际化广告商业平台

    字节跳动 · 深圳市
    AI 估算 · 30k-50k
  • 大语言模型通用Agent研究工程师-Seed

    字节跳动 · 北京市
    AI 估算 · 30k-60k
  • 推荐算法工程师(多端电商)-抖音电商

    字节跳动 · 杭州市
    AI 估算 · 35k-65k
  • 国际战略专家-TikTok Shop

    字节跳动 · 北京市
    AI 估算 · 25k-40k

相似职位推荐

  • 昆仑芯-芯片研发实习生(J83484)

    百度 · 北京市
    AI 估算 · 6k-10k
  • 广告算法工程师实习生(J97403)

    百度 · 上海市
    AI 估算 · 5k-8k
  • 生态研发组_实习PNC规控算法工程师(J71278)

    百度 · 北京市
    AI 估算 · 4k-8k
  • 推荐策略实习生(J72891)

    百度 · 北京市
    AI 估算 · 5k-8k
  • 大模型/多模态算法工程师(J94551)

    百度 · 北京市
    AI 估算 · 30k-50k