Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
训练性能优化专家-计算
立即应聘

训练性能优化专家-计算

发布于 大约 14 小时前

普通员工/个人贡献者

杭州市
高级经验
全职员工
仅现场办公
学历未注明
GPU
PyTorch
TensorFlow
RDMA
分布式训练
DeepSpeed
智能驾驶
国产Ai芯片

AI 估算 · 35k–60k

高级技术专家岗位,字节跳动薪资偏高,结合杭州市场和AI方向高需求,月薪区间合理。

职位详情

关于这个职位

该职位负责智能驾驶全栈模型的训练性能优化,包括混合精度训练、稀疏化、梯度压缩等技术落地,以及PB级数据集群分布式训练的通信优化与架构设计

需要精通C++/Python、PyTorch/TensorFlow内核,并具备AI芯片集群适配经验
适合有5年以上AI领域经验、3年以上自动驾驶训练优化背景的技术专家

最低要求

年以上AI领域实战经验,3年以上智能驾驶服务器端训练优化经验,主导过工业级集群训练项目,有可验证成果

精通C++/Python高性能编程,深入理解PyTorch/TensorFlow内核与分布式训练逻辑(DDP/DeepSpeed ZeRO),具备神经网络优化、并行计算、多模态数据处理基础
熟悉BEV感知/3D检测等模型训练原理
至少深耕任一方向:智能驾驶模型量化/稀疏化/梯度压缩及端到端集群训练优化,或集群架构设计/RDMA优化/混合并行策略/海量数据传输优化,或核心算子开发/TVM编译优化/服务器芯片指令集适配
了解主流服务器AI硬件架构与指令集,熟练运用PyTorch Profiler/NVIDIA Nsight/国产Profiling工具等集群诊断工具,具备全链路瓶颈定位能力

工作职责

模型训练优化:主导智能驾驶全栈模型(感知/BEV融合/预测/规划)服务器端训练优化,落地混合精度训练、结构化稀疏化、梯度压缩技术,平衡模型精度、训练效率与服务器资源开销

构建训练性能基准体系与自动化调优/测试管线,支撑规模化训练迭代
集群分布式优化:攻坚自动驾驶PB级多传感器数据的集群分布式训练,优化跨节点RDMA/TCP通信、低延迟序列化与动态拓扑
适配GPU/国产AI芯片集群,通过数据分片、混合并行(数据+模型+张量+流水线)、通信-计算重叠,突破传输瓶颈,保障训练稳定性

AI 洞察

优缺点分析

优点

  • 字节跳动平台资源丰富,可接触大规模集群和前沿硬件
  • 薪资待遇优厚,股权激励机会多
  • 技术栈前沿,如DeepSpeed、RDMA、国产芯片适配,提升市场竞争力
  • 对技术深度和广度要求极高,需要同时精通算法、系统和硬件
  • 国产芯片生态尚不成熟,适配和维护工作量可能较大
  • 适合具备深厚AI系统工程背景、热爱性能优化和分布式计算、希望在自动驾驶领域深入发展的技术专家

缺点 / 挑战

  • 身处自动驾驶和AI训练的核心赛道,技术挑战大,积累高价值经验
  • 自动驾驶数据量巨大,训练稳定性与效率优化压力大

角色解读

  • 可晋升为技术专家/架构师,主导更大规模的训练基础设施设计
  • 横向扩展至自动驾驶全栈算法优化或芯片协同设计领域
  • 有机会领导团队,成为分布式训练技术负责人
  • 主导智能驾驶全栈模型的训练优化,应用混合精度、稀疏化和梯度压缩技术,平衡精度与效率
  • 构建训练性能基准和自动化调优管线,推动高效迭代
  • 优化PB级数据的分布式训练,突破RDMA通信和混合并行策略的瓶颈
  • 适配GPU和国产AI芯片集群,保障训练稳定性和可扩展性
  • 精通C++/Python高性能编程,深入理解PyTorch/TensorFlow分布式训练机制
  • 掌握神经网络优化、并行计算、多模态数据处理,熟悉BEV/3D检测模型
  • 具备集群架构设计、RDMA优化、算子开发或TVM编译优化等方向深度能力
  • 熟练使用Profiling工具(如Nsight、PyTorch Profiler)进行性能瓶颈分析

申请策略

  • 准备一个完整的训练性能优化案例,展示从问题定位到方案落地的全过程
  • 了解字节跳动智能驾驶业务的最新进展,体现对业务场景的理解
  • 突出5年以上AI经验,特别是智能驾驶训练优化的工业级项目成果
  • 详细描述在混合精度、稀疏化、分布式通信优化等方面的具体工作和量化指标
  • 展示对PyTorch/TensorFlow内核的深入理解,以及Profiling工具的使用案例
  • 如涉及国产芯片适配,强调兼容性调试和性能调优经验
  • 补充学习TVM编译优化和算子开发,提升端到端优化能力
  • 熟悉主流国产AI芯片(如华为昇腾、寒武纪)的架构和Profiling工具

面试指南

  • 先明确问题场景和目标,再通过工具定位瓶颈,然后提出并验证解决方案
  • 结合理论和实践经验,强调关键参数调整和系统架构选择
  • 展示量化结果(如加速比、收敛曲线),体现工程思维
  • 如何诊断并优化一个分布式训练任务中的通信瓶颈?
  • 混合精度训练中可能出现哪些数值问题?如何解决?
  • 描述一次你主导的集群训练项目,遇到过哪些挑战?
  • 国产AI芯片和NVIDIA GPU在训练优化上有何异同?
  • 如何在不影响模型精度的情况下,显著减少训练时间?

匹配度报告

74
综合匹配度

顶尖AI训练优化岗位,技术前沿且稀缺,但工作强度大、WLB一般。

适合人群
最看重技术成长和前沿挑战的求职者,能接受高强度工作以换取顶尖技术积累和薪资回报。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展90
工作生活50
使命价值70

薪资福利匹配

85较高

字节跳动为已上市巨头,薪资福利具备竞争力,但具体数额需面议;职位描述未明确福利,但大厂通常有完善保障。

薪资信号面议 (35K-60K/月)

成长发展匹配

90较高

该岗位涉及前沿技术栈(DeepSpeed、国产芯片适配)和自动驾驶核心业务,技术成长空间极大,但未明确提及晋升路径。

技术前沿前沿/新兴技术
技术栈混合精度训练、结构化稀疏化、梯度压缩、RDMA、DeepSpeed、TVM、国产AI芯片
业务类型profit_center

工作生活匹配

50较低

仅现场办公,且自动驾驶训练优化可能面临高强度工作节奏,WLB信号未提及。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值匹配

70中等

自动驾驶行业属于高速增长赛道,但当前社会对自动驾驶安全性的关注可能带来一定压力,个人使命感中等。

行业发展高速增长赛道
社会影响正向社会影响力较高
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 品牌广告产品经理(品牌竞价方向)-中国商业产品与技术(北京/上海)

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 商品策略运营(作者方向)-抖音电商

    字节跳动 · 北京市
    AI 估算 · 20k-40k
  • 高级抖音用户产品经理-汽水音乐

    字节跳动 · 北京市
    AI 估算 · 25k-40k
  • iOS资深研发工程师-TikTok搜索

    字节跳动 · 上海市
    AI 估算 · 30k-50k
  • 平台治理前端开发工程师-生活服务

    字节跳动 · 上海市
    AI 估算 · 25k-45k

相似职位推荐

  • AI Agent算法专家(智能创作方向)

    快手 · 北京市
    AI 估算 · 35k-55k
  • Function & Baseline Management

    大众汽车 · 合肥市
    AI 估算 · 20k-30k
  • 【26年度台湾地区青年实习】机械制造设计(东航资产)

    中国东方航空 · 上海市
    AI 估算 · 4k-6k
  • 大模型应用评测算法工程师

    美团 · 北京市
    AI 估算 · 25k-45k

字节跳动 的其他在招职位

  • 品牌广告产品经理(品牌竞价方向)-中国商业产品与技术(北京/上海)

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 商品策略运营(作者方向)-抖音电商

    字节跳动 · 北京市
    AI 估算 · 20k-40k
  • 高级抖音用户产品经理-汽水音乐

    字节跳动 · 北京市
    AI 估算 · 25k-40k
  • iOS资深研发工程师-TikTok搜索

    字节跳动 · 上海市
    AI 估算 · 30k-50k
  • 平台治理前端开发工程师-生活服务

    字节跳动 · 上海市
    AI 估算 · 25k-45k

相似职位推荐

  • AI Agent算法专家(智能创作方向)

    快手 · 北京市
    AI 估算 · 35k-55k
  • Function & Baseline Management

    大众汽车 · 合肥市
    AI 估算 · 20k-30k
  • 【26年度台湾地区青年实习】机械制造设计(东航资产)

    中国东方航空 · 上海市
    AI 估算 · 4k-6k
  • 大模型应用评测算法工程师

    美团 · 北京市
    AI 估算 · 25k-45k