Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

ByteDance logo
字节跳动
机器学习系统研发工程师-Ads Infra
立即应聘

机器学习系统研发工程师-Ads Infra

发布于 大约 11 小时前

普通员工/个人贡献者

北京市
高级经验
全职员工
仅现场办公
本科
软件工程
分布式系统
GPU
PyTorch
TensorFlow
高性能计算
CUDA
编译优化
广告推荐

AI 估算 · 35k–70k

字节跳动核心广告技术岗位,技术栈前沿,北京互联网大厂薪资水平高,预计月薪35k-70k。

职位详情

关于这个职位

该职位是字节跳动广告基础设施团队的机器学习系统研发工程师,专注于广告/推荐/搜索场景下的模型训练和推理性能优化

你将通过编译优化、并行计算、高性能算子开发等技术,打造业界领先的高性能训推引擎,并跟进最新GPU/NPU架构和编译优化技术
适合对系统性能极致追求、具备扎实C++/Python和分布式系统功底的技术人才

最低要求

本科及以上学历,计算机等相关专业,具备扎实的计算机基础

熟悉Linux操作系统和开发环境,熟练掌握C/C++/Python等一种或多种编程语言并深入了解语言特性,具备良好的数据结构、算法基础和系统设计能力
拥有强烈的求知欲、优秀的学习和沟通能力
熟悉至少一种机器学习框架(PyTorch/TensorFlow/PaddlePaddle或其他自研框架),熟练掌握分布式系统原理,参与过分布式系统的设计、开发和维护

工作职责

针对广告/推荐/搜索等场景,优化模型训练/推理的计算图执行效率

通过编译优化、模型并行优化、图融合、高性能算子开发、低精度计算、Memory复用、Cache优化、高并发服务请求优化等技术,打造业界领先的高性能训推引擎
设计和开发高性能算子库,研究最新的GPU计算技术和优化方法,以充分利用GPU/NPU的并行计算能力,支持各种机器学习和深度学习模型的构建和部署
负责机器学习系统前瞻技术的调研和引入,例如最新硬件架构、异构计算系统、GPU优化技术、编译优化技术的引入和落地

优先资格

熟悉主流高性能并行编程技术,有GPU编程经验(CUDA或Triton)

有TensorRT/CUTLASS开发经验,熟悉TRT-LLM、vLLM等推理框架
熟悉开源ML编译器代码(XLA/MLIR/TVM)并有相关开发经验
熟悉PyTorch、FSDP、DeepSpeed、Megatron等业界主流分布框架的使用和原理

AI 洞察

优缺点分析

优点

  • 接触业界最前沿的GPU/NPU技术、编译优化和分布式系统,技能积累高
  • 薪资待遇优厚,大厂福利完善(年终奖、期权、补充医疗等)
  • 团队技术氛围浓厚,与优秀同事合作,快速提升专业水平
  • 技术门槛高,需要扎实的系统编程和并行计算功底,学习曲线陡峭
  • 广告业务对性能极致要求,可能涉及高工作强度和紧急项目
  • 技术更新迭代快,需要持续学习最新硬件和优化方法
  • 适合对系统性能有极致追求、热爱底层优化和分布式计算的优秀工程师,尤其是具备GPU编程或编译器经验的候选人

缺点 / 挑战

  • 字节跳动核心广告业务,技术挑战大,成长空间广阔

角色解读

  • 技术深度方向:成为GPU计算/编译优化专家,主导核心训推引擎架构
  • 系统架构方向:晋升为系统架构师,负责大规模分布式训练基础设施设计
  • 管理方向:表现优异可转为技术主管,带领团队攻克性能挑战
  • 优化广告/推荐场景下模型训练和推理的计算效率,包括图融合、算子优化、并行策略等
  • 开发高性能GPU/NPU算子库,利用CUDA、Triton等技术提升硬件利用率
  • 调研并引入最新硬件架构和编译优化技术(如XLA、MLIR),提升系统性能
  • 参与分布式训练/推理系统的设计与维护,确保高并发、低延迟服务
  • 精通C++/Python,具备扎实的数据结构与算法基础
  • 深入理解至少一种深度学习框架(PyTorch/TensorFlow)及分布式系统原理
  • 熟悉GPU编程(CUDA)或高性能计算,有算子开发或编译优化经验优先
  • 熟悉Linux环境,具备系统级性能调优能力

申请策略

  • 深入了解字节跳动广告技术栈,面试时展示对业务场景的理解
  • 准备一个完整的性能优化项目故事,包括问题分析、方案设计、效果验证
  • 重点突出GPU编程经验(CUDA/Triton)、算子开发或编译优化项目
  • 展示分布式系统设计或优化案例(如模型并行、数据并行、通信优化)
  • 列出在深度学习框架上的深度使用经历,如PyTorch源码阅读或二次开发
  • 强调性能调优成果:加速比、吞吐量提升等量化指标
  • 补充编译优化知识:学习XLA、MLIR、TVM等开源编译器
  • 熟悉主流分布式训练框架:DeepSpeed、Megatron、FSDP等

面试指南

  • 分层次回答:算法优化→计算图优化→算子优化→硬件利用
  • 结合具体案例
  • 从原理到实现:先讲理论基础,再讲工程实践,最后量化对比
  • 使用STAR法则:情境、任务、行动、结果,突出个人贡献
  • 如何优化一个PyTorch模型的训练速度?请从多个层面分析
  • 解释GPU的warp调度和bank conflict,如何避免?
  • 设计一个分布式AllReduce通信优化方案
  • 介绍你参与过的算子开发或编译优化项目,难点和成果

职位点评

70
综合评分

字节核心广告技术岗,前沿GPU/编译优化,薪资优厚,但工作强度大。

更适合这类人
适合追求技术深度和职业发展、愿意接受高强度工作的工程师。
表现最好
成长发展
相对薄弱
工作生活
薪资福利80
成长发展95
工作生活40
使命价值65

薪资福利

80较高

字节跳动作为大型互联网上市公司,提供有竞争力的薪资和福利,但JD未明确具体薪资和福利细节,补偿动机满足度较高。

薪资信号未披露(AI估算:35K-70K/月)

成长发展

95较高

该职位涉及GPU计算、编译优化、分布式系统等前沿技术,成长空间极大,JD明确要求跟踪最新技术,发展动机高度满足。

技术前沿前沿/新兴技术
技术栈GPU、CUDA、Triton、TensorRT、CUTLASS、XLA、MLIR、TVM、PyTorch、DeepSpeed、Megatron、FSDP
业务类型profit_center

工作生活

40较低

JD未提及工作时间和灵活性,且字节跳动通常工作节奏较快,办公地点仅北京现场,生活动机满足度较低。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值

65中等

广告技术属于高速增长赛道,但社会影响力中性,属于商业技术赋能,意义感中等。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 多媒体处理高级开发工程师

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 招聘专家-广告

    字节跳动 · 北京市
    AI 估算 · 20k-35k
  • 自动化开发专家-TikTok(杭州/上海)

    字节跳动 · 杭州市
    AI 估算 · 35k-65k
  • AI业务研发工程师-TikTok Shop

    字节跳动 · 上海市
    AI 估算 · 25k-50k
  • 平台产品经理(游戏AI方向)-抖音

    字节跳动 · 深圳市
    AI 估算 · 25k-45k

相似职位推荐

  • Student Intern-SYNC

    西门子 · 上海市
    AI 估算 · 4k-6k
  • Advanced Software Engineer-C++

    飞利浦 · 沈阳市
    AI 估算 · 15k-25k
  • Advanced Software Engineer-C++

    飞利浦 · 沈阳市
    AI 估算 · 25k-40k
  • 2027 Campus - Software Development Engineer - Industrial & IoT

    恩智浦半导体 · 北京市
    AI 估算 · 15k-25k
  • 大模型推理部署优化实习生-AI引擎

    米哈游 · 上海市
    AI 估算 · 4k-8k

字节跳动 的其他在招职位

  • 多媒体处理高级开发工程师

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 招聘专家-广告

    字节跳动 · 北京市
    AI 估算 · 20k-35k
  • 自动化开发专家-TikTok(杭州/上海)

    字节跳动 · 杭州市
    AI 估算 · 35k-65k
  • AI业务研发工程师-TikTok Shop

    字节跳动 · 上海市
    AI 估算 · 25k-50k
  • 平台产品经理(游戏AI方向)-抖音

    字节跳动 · 深圳市
    AI 估算 · 25k-45k

相似职位推荐

  • Student Intern-SYNC

    西门子 · 上海市
    AI 估算 · 4k-6k
  • Advanced Software Engineer-C++

    飞利浦 · 沈阳市
    AI 估算 · 15k-25k
  • Advanced Software Engineer-C++

    飞利浦 · 沈阳市
    AI 估算 · 25k-40k
  • 2027 Campus - Software Development Engineer - Industrial & IoT

    恩智浦半导体 · 北京市
    AI 估算 · 15k-25k
  • 大模型推理部署优化实习生-AI引擎

    米哈游 · 上海市
    AI 估算 · 4k-8k