Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

ByteDance logo
字节跳动
资深大模型训练推理算子高性能优化工程师-Data AML
立即应聘

资深大模型训练推理算子高性能优化工程师-Data AML

发布于 大约 11 小时前

普通员工/个人贡献者

北京市
高级经验
全职员工
仅现场办公
本科
软件工程
多模态
CUDA
MLIR
AIGC
TVM
GEMM
Torch.Compile
低比特量化
稀疏

AI 估算 · 50k–80k

涉及前沿AI技术,技能稀缺,市场竞争力强,薪资属于行业顶尖水平。

职位详情

关于这个职位

作为字节跳动Data AML团队的资深大模型训练推理算子高性能优化工程师,你将专注于多模态生成与理解模型的训练和推理核心算子的高性能优化,直接支持抖音、剪映等产品的AI功能落地

这是一个深度参与前沿AI技术、解决算力挑战的高技术岗位

最低要求

本科及以上学历,计算机/电子/信息/通信/自动化/软件等相关专业优先

有AI工程系统优化经验
深入理解计算机体系结构、熟悉CUDA/AscendC/BangC中的一种或者多种,熟悉计算密集型算子如Flash Attention、Conv2d、GEMM、GEMV实现和加速
具备良好的交流沟通能力、业务意识、团队合作精神

工作职责

负责研发多模态生成、多模态理解等方向模型训练、推理核心算子的高性能优化工作

支持抖音、剪映、即梦等产品生成式AI算法模型落地,支撑字节跳动AI技术的发展

优先资格

具有低比特量化、稀疏等优化技术经验者优先

了解Torch.compile、TVM、MLIR等编译优化原理并具备相关技术优化经验优先
了解主流AIGC、多模态算法模型原理,有AIGC模型并行训练或推理优化经验优先

AI 洞察

优缺点分析

优点

  • 处于AI大模型最热门赛道,技术前沿性强,积累经验后市场价值极高
  • 字节跳动提供海量真实数据和业务场景,优化成果直接服务于亿级用户产品
  • 团队技术氛围浓厚,可与业内顶尖工程师合作,快速提升技术水平
  • 技术难度大,需要深入理解硬件和复杂算法,学习曲线陡峭
  • 需要持续跟进业界最新技术(如新硬件、新模型架构),保持竞争力

缺点 / 挑战

  • 工作强度较高,可能面临较紧的项目周期和性能压力
  • 适合对底层计算和性能优化有浓厚兴趣、享受技术挑战、能适应高强度工作的技术追求者

角色解读

  • 技术专家路线:在算子优化领域深耕,成为GPU/NPU计算优化领域的权威
  • 架构师路线:参与AI芯片协同设计或AI编译器开发,影响更广泛的生态系统
  • 管理路线:带领优化团队,负责大规模AI系统的整体性能
  • 负责多模态生成与理解模型的训练和推理核心算子(如Attention、卷积、矩阵乘)的高性能优化,提升计算效率
  • 深入底层硬件架构(GPU/NPU),使用CUDA/AscendC等编程语言实现算子加速
  • 支持字节跳动旗下抖音、剪映等产品的AI功能落地,解决实际算力瓶颈
  • 探索低比特量化、稀疏化等前沿优化技术,以及编译优化(TVM/MLIR)以进一步提升性能
  • 精通CUDA/AscendC/BangC中的至少一种,熟悉GPU/NPU体系结构
  • 深入理解计算机体系结构,有AI工程系统优化经验
  • 熟悉常见计算密集型算子(Flash Attention, Conv2d, GEMM等)的实现与加速方法
  • 了解AIGC、多模态模型原理,具备并行训练或推理优化经验更佳

申请策略

  • 在简历和面试中展示对高性能计算的热爱和动手能力,可以带上自己的优化项目代码
  • 了解字节跳动在AI基础设施方面的公开资料(如ByteMLPerf),体现对公司的研究
  • 突出GPU/NPU相关的项目经验,尤其是算子优化或高性能计算方面的成果(如加速比、延迟降低等量化指标)
  • 强调对CUDA/AscendC等语言的熟练程度,以及熟悉Flash Attention等常用算子的实现细节
  • 如果有模型并行训练或推理优化经验,务必重点描述
  • 展示对底层体系结构的理解,如缓存、内存带宽、计算单元等
  • 系统学习CUDA编程和GPU体系结构,可参考《CUDA C++ Programming Guide》和《Professional CUDA C Programming》
  • 动手实现一个Attention或Conv算子的优化版本,对比原生性能

面试指南

  • 对于技术问题,采用“问题-分析-方案-验证”的结构,先明确目标,再分析瓶颈(计算/访存),接着提出优化策略(如tiling、向量化、共享内存等),最后用实验结果证明
  • 对于项目经验,使用STAR法则(Situation, Task, Action, Result),重点突出你的贡献和量化成果
  • 如何优化一个Flash Attention算子?请从算法和硬件层面分析
  • 解释SIMT(Single Instruction Multiple Thread)和指令级并行、线程级并行的区别
  • 描述一个你曾经做过的算子优化项目,包括遇到的瓶颈和如何解决的
  • 什么是warp divergence?如何避免?
  • 了解过AscendC/BangC吗?它们与CUDA的主要异同是什么?
  • 复习计算机体系结构基础知识,如缓存层级、内存带宽、延迟隐藏等

职位点评

69
综合评分

前沿AI技术赛道,薪资优厚,成长空间巨大,但工作强度大,WLB较差。

更适合这类人
最适合追求技术前沿、高薪回报,愿意承受高强度工作的求职者。
表现最好
成长发展
相对薄弱
工作生活
薪资福利75
成长发展90
工作生活40
使命价值70

薪资福利

75中等

薪资优厚,属于行业顶尖水平,但JD未明确披露具体薪资范围,福利未提及。

薪资信号未披露(AI估算:50K-80K/月)

成长发展

90较高

技术前沿性极强,涉及AIGC、多模态、底层优化等热门方向,成长空间大,但JD未提及培训或晋升通道。

技术前沿前沿/新兴技术
技术栈CUDA、AscendC、Flash Attention、GEMM、低比特量化、稀疏、Torch.compile、TVM、MLIR、AIGC、多模态
业务类型profit_center

工作生活

40较低

工作地点固定在北京办公,未提及弹性工作或远程,且字节跳动通常工作强度较大,WLB一般。

工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值

70中等

AI大模型属于高速增长赛道,技术影响力大,但社会价值中性,主要服务于商业产品。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 多媒体处理高级开发工程师

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 招聘专家-广告

    字节跳动 · 北京市
    AI 估算 · 20k-35k
  • 自动化开发专家-TikTok(杭州/上海)

    字节跳动 · 杭州市
    AI 估算 · 35k-65k
  • AI业务研发工程师-TikTok Shop

    字节跳动 · 上海市
    AI 估算 · 25k-50k
  • 平台产品经理(游戏AI方向)-抖音

    字节跳动 · 深圳市
    AI 估算 · 25k-45k

相似职位推荐

  • Student Intern-SYNC

    西门子 · 上海市
    AI 估算 · 4k-6k
  • Advanced Software Engineer-C++

    飞利浦 · 沈阳市
    AI 估算 · 15k-25k
  • Advanced Software Engineer-C++

    飞利浦 · 沈阳市
    AI 估算 · 25k-40k
  • 2027 Campus - Software Development Engineer - Industrial & IoT

    恩智浦半导体 · 北京市
    AI 估算 · 15k-25k
  • 大模型推理部署优化实习生-AI引擎

    米哈游 · 上海市
    AI 估算 · 4k-8k

字节跳动 的其他在招职位

  • 多媒体处理高级开发工程师

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 招聘专家-广告

    字节跳动 · 北京市
    AI 估算 · 20k-35k
  • 自动化开发专家-TikTok(杭州/上海)

    字节跳动 · 杭州市
    AI 估算 · 35k-65k
  • AI业务研发工程师-TikTok Shop

    字节跳动 · 上海市
    AI 估算 · 25k-50k
  • 平台产品经理(游戏AI方向)-抖音

    字节跳动 · 深圳市
    AI 估算 · 25k-45k

相似职位推荐

  • Student Intern-SYNC

    西门子 · 上海市
    AI 估算 · 4k-6k
  • Advanced Software Engineer-C++

    飞利浦 · 沈阳市
    AI 估算 · 15k-25k
  • Advanced Software Engineer-C++

    飞利浦 · 沈阳市
    AI 估算 · 25k-40k
  • 2027 Campus - Software Development Engineer - Industrial & IoT

    恩智浦半导体 · 北京市
    AI 估算 · 15k-25k
  • 大模型推理部署优化实习生-AI引擎

    米哈游 · 上海市
    AI 估算 · 4k-8k