Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

ByteDance logo
字节跳动
火山引擎机器学习异构硬件开发工程师-Data AML
立即应聘

火山引擎机器学习异构硬件开发工程师-Data AML

发布于 大约 11 小时前

普通员工/个人贡献者

北京市
高级经验
全职员工
仅现场办公
学历未注明
研究与开发 (研发)
深度学习
PyTorch
LLM
编译器优化
CUDA
并行计算
MLIR
异构计算
昇腾

AI 估算 · 30k–60k

字节跳动薪资在互联网大厂中属第一梯队,北京高级机器学习工程师月薪普遍在30k-60k之间,该岗位技术要求高,涉及异构芯片等前沿方向,薪资竞争力强。

职位详情

关于这个职位

该职位负责将异构计算芯片(如寒武纪、昇腾)落地到字节跳动机器学习平台,涉及芯片评估、模型推理/训练适配、高性能算子开发及编译器优化

你将与团队一起推动国产芯片在AI场景的大规模应用,解决性能瓶颈,提升业务收益
适合对硬件底层和深度学习有深厚兴趣的工程师

最低要求

熟练掌握Linux环境下的C/C++、Python语言

能够熟练使用PyTorch,熟悉底层原理及相关实现
有国产芯片开发经验,寒武纪、昇腾,了解其推理/训练/通信相关优化,具备扎实的计算机科学功底和编程能力,熟悉常见算法和数据结构,具有良好的编程风格
熟悉至少一种经典深度学习模型及其应用场景,如LLM、DiT、Bevformer等
熟悉至少一种并行计算架构,熟悉其编程模型,并知晓其优劣所在
有良好的工作文档习惯,及时按要求撰写更新工作流程及技术文档

工作职责

主要负责异构计算芯片在机器学习平台的落地,会涉及异构计算芯片的评估、调研,及相关模型的推理、训练的适配、优化等工作

[评估]:负责评估符合业务要求的异构计算芯片,建立/完善评估体系、负载模型,预估业务收益
[推理]:负责异构计算芯片落地实际推理业务,适配异构计算芯片特性,降低推理时延,提高推理吞吐
[训练]:负责异构计算芯片落地实际训练业务,根据芯片计算、通信特性,优化显存占用,提高训练吞吐
[算子]:负责开发异构计算芯片的高性能算子,根据芯片特性,优化算力、带宽利用率
[编译]:负责通过编译技术实现异构计算芯片在不同业务场景中落地,负责实现更加高效的异构硬件编程范式

优先资格

有高性能算子、大规模训练、通算融合领域经验者优先

了解SIMD/SIMT外其他并行计算模型及算法,了解其并行编程模型及其优、缺点者优先
了解GPU硬件架构,了解GPU软件栈(CUDA,cuBLAS、cuTLASS),具备GPU性能分析的能力者优先
了解AI Compiler技术栈(MLIR等),熟悉Torch2.0+编译栈、Triton优先者优先

AI 洞察

优缺点分析

优点

  • 前沿技术栈:涉及国产芯片、编译优化、大规模训练,技术壁垒高,积累的技能稀缺性强
  • 大厂平台:字节跳动业务规模大,能接触到海量数据和真实场景,工作成果直接产生业务影响
  • 团队氛围:Data AML团队技术氛围浓厚,内部有丰富的培训和分享,个人成长快
  • 工作强度:字节跳动节奏快,项目时间紧张,可能需要应对突发性能问题或紧急上线
  • 技术难度:异构芯片生态不成熟,调试和优化工作复杂,需要较强的跨领域知识(硬件+软件+算法)

缺点 / 挑战

  • 竞争压力:团队内牛人众多,对技术深度和迭代速度要求高,需要持续学习新芯片和框架
  • 适合对底层硬件和AI框架有强烈兴趣,喜欢挑战性能极限,能适应快速迭代节奏的资深工程师

角色解读

  • 技术深耕:成为异构计算专家,主导芯片选型和性能优化策略
  • 架构升级:转向AI系统架构师,设计端到端的训练/推理平台
  • 横向拓展:结合业务(推荐、搜索、广告)理解,推动芯片在不同场景落地
  • 评估和选型异构计算芯片(如寒武纪、昇腾),建立测试体系和收益模型,为业务推荐最优硬件方案
  • 将AI模型(LLM、DiT等)适配到新芯片上,优化推理延迟和训练吞吐,解决显存和通信瓶颈
  • 开发高性能算子(如卷积、矩阵乘法),利用芯片特性最大化算力和带宽利用率
  • 使用编译技术(MLIR、Triton)自动化硬件适配,提升编程效率和部署便捷性
  • 精通C/C++和Python,能熟练使用PyTorch并理解底层原理
  • 有国产芯片(寒武纪、昇腾等)开发经验,熟悉其推理/训练/通信优化
  • 深入理解深度学习模型(LLM、DiT等)和并行计算架构(数据并行、模型并行等)
  • 具备扎实的计算机基础(算法、数据结构)和良好的文档习惯

申请策略

  • 关注字节跳动的技术开放日和峰会,了解Data AML团队的技术方向,可在面试中体现对业务的思考
  • 突出国产芯片或GPU(NVIDIA)的底层优化经验,如具体模型加速比、显存节省等量化成果
  • 展示PyTorch或TensorFlow的底层修改经历,如自定义算子、内存优化等
  • 强调并行编程(CUDA、OpenCL)和编译技术(MLIR、TVM)的项目经验
  • 如有开源贡献或技术博客(如优化案例分析),强烈建议附上链接
  • 如果缺乏国产芯片经验,可以学习寒武纪CAMPI或昇腾CANN的编程模型,在线文档和模拟器即可入门
  • 加深对AI编译器(MLIR、Triton)的理解,尝试复现一些算子自动调优的案例
  • 补充大规模分布式训练知识(如DeepSpeed、Megatron),了解通信和计算重叠的优化方法

面试指南

  • 对于评估类问题:先建立指标体系(吞吐、延迟、能效),再设计标准化测试负载(典型模型),最后对比收益和成本
  • 对于优化类问题:从瓶颈分析出发(计算、显存、通信),结合芯片特性(带宽、算子库),提出分阶段优化方案(如算子替换、内存复用、编译图优化)
  • 如何评估一款新芯片是否适合我们的推理/训练场景?请设计评估流程
  • 针对LLM推理,如何利用芯片特性实现显存优化?请举例说明
  • 请解释PyTorch中autograd的工作原理,以及如何自定义一个支持反向传播的算子
  • 什么是算子融合?MLIR如何帮助实现自动化算子融合?
  • 你在之前的项目中使用过哪些并行策略(数据并行、模型并行、流水线并行)?各自的优缺点和适用场景?
  • 复习GPU架构(例如NVIDIA的Ampere、Hopper)和CUDA编程模型,因为面试常以此作为参照

职位点评

72
综合评分

字节跳动前沿技术岗,高薪资高成长,但工作强度大,WLB较差。

更适合这类人
该职位最适合追求技术前沿和快速成长、不在意工作生活平衡的求职者。
表现最好
成长发展
相对薄弱
工作生活
薪资福利85
成长发展95
工作生活40
使命价值70

薪资福利

85较高

字节跳动薪资位于行业领先水平,福利完善(五险一金、补充医疗、免费三餐等),但未在JD中明确薪资,故信号为'未披露'。综合判断补偿性动机满足程度较高。

薪资信号未披露(AI估算:30K-60K/月)

成长发展

95较高

该岗位涉及异构芯片、编译器、大规模训练等前沿技术,技术栈新颖,成长空间巨大。JD中提到'优化'、'评估'、'适配'等高频词,暗示项目驱动型成长,但未明确提及晋升通道。

技术前沿前沿/新兴技术
技术栈C/C++、Python、PyTorch、异构计算、国产芯片、LLM、MLIR、Triton、CUDA、并行计算
业务类型ambiguous

工作生活

40较低

工作地点在北京核心区域(海淀区),但字节跳动工作节奏快,JD未提及弹性工作或WLB,结合行业特点推测加班较多,生活化动机满足程度有限。

工作模式未明确
办公地点市区核心地段
加班情况JD含高强度暗示词

使命价值

70中等

该岗位推动国产芯片在AI场景落地,具有技术自主可控的社会价值,但JD未直接提及使命感。行业处于高速增长赛道,创新程度高。

行业发展高速增长赛道
社会影响正向社会影响力较高
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 多媒体处理高级开发工程师

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 招聘专家-广告

    字节跳动 · 北京市
    AI 估算 · 20k-35k
  • 自动化开发专家-TikTok(杭州/上海)

    字节跳动 · 杭州市
    AI 估算 · 35k-65k
  • AI业务研发工程师-TikTok Shop

    字节跳动 · 上海市
    AI 估算 · 25k-50k
  • 平台产品经理(游戏AI方向)-抖音

    字节跳动 · 深圳市
    AI 估算 · 25k-45k

相似职位推荐

  • 化學實驗室-前處理人員(台北日班)

    通标标准技术服务有限公司 · Xingzhen Village, New Taipei City, Taiwan
    AI 估算 · 6k-9k
  • AI Standards & Ecosystem | Sr. Staff Engineer

    高通 · 北京市
    AI 估算 · 60k-100k
  • 具身智能算法实习生

    网易 · 杭州市
    AI 估算 · 4k-8k
  • 游戏研发实习生(引擎方向)

    网易 · 上海市
    AI 估算 · 4k-6k
  • 图形学研究员实习生(动作生成方向)

    米哈游 · 上海市
    AI 估算 · 4k-8k

字节跳动 的其他在招职位

  • 多媒体处理高级开发工程师

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 招聘专家-广告

    字节跳动 · 北京市
    AI 估算 · 20k-35k
  • 自动化开发专家-TikTok(杭州/上海)

    字节跳动 · 杭州市
    AI 估算 · 35k-65k
  • AI业务研发工程师-TikTok Shop

    字节跳动 · 上海市
    AI 估算 · 25k-50k
  • 平台产品经理(游戏AI方向)-抖音

    字节跳动 · 深圳市
    AI 估算 · 25k-45k

相似职位推荐

  • 化學實驗室-前處理人員(台北日班)

    通标标准技术服务有限公司 · Xingzhen Village, New Taipei City, Taiwan
    AI 估算 · 6k-9k
  • AI Standards & Ecosystem | Sr. Staff Engineer

    高通 · 北京市
    AI 估算 · 60k-100k
  • 具身智能算法实习生

    网易 · 杭州市
    AI 估算 · 4k-8k
  • 游戏研发实习生(引擎方向)

    网易 · 上海市
    AI 估算 · 4k-6k
  • 图形学研究员实习生(动作生成方向)

    米哈游 · 上海市
    AI 估算 · 4k-8k