Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

ByteDance logo
字节跳动
性能优化工程师(AI计算方向)-基础库与工具链
立即应聘

性能优化工程师(AI计算方向)-基础库与工具链

发布于 大约 11 小时前

普通员工/个人贡献者

北京市
中级经验
全职员工
仅现场办公
学历未注明
软件工程
GPU
NLP
PyTorch
性能优化
TensorFlow
LLM
XLA
CPU架构
AI计算

AI 估算 · 30k–60k

北京AI方向性能优化岗位,技术难度高,市场需求旺盛,大厂薪资具有竞争力。

职位详情

关于这个职位

该职位负责AI推理与训练场景的性能优化,深入分析软硬件瓶颈,利用CPU/GPU架构及编译技术提升业务性能

适合对底层系统有热情、有AI框架优化经验的工程师

最低要求

了解计算机体系结构、操作系统原理、编译原理、计算机网络中的基本概念和原理

任一场景,LLM/NLP/推荐/视觉/语音下的训练、推理部署优化相关实践经验
熟悉一种AI模型训练或推理框架(PyTorch或者Tensorflow)

工作职责

观测和分析在离线推理和训练场景的业务特点,例如软件热点,硬件瓶颈等,提出优化方案

利用通用CPU(如ARM、X86、RISC-V等)、GPU、AI加速器架构特点、结合编译/操作系统/高性能库等底层软件技术,联合业务团队,极致优化指定业务性能
导入异构卡构建/编译方案,适配业务场景,并进行性能评估

优先资格

了解AI场景的模型/算子编译优化(例如Xla/Torch.Compile/Triton)优先

有性能评估/预估,算子性能优化、AI计算软硬件协同设计相关实践经验者优先

AI 洞察

优缺点分析

优点

  • 接触前沿AI计算技术和底层优化,技术积累深厚
  • 大平台资源丰富,可参与超大规模AI系统优化
  • 团队技术氛围浓厚,有较多学习成长机会
  • 工作强度较大,需应对复杂的技术难题和紧迫的项目周期
  • 对计算机底层知识要求极高,学习曲线陡峭
  • 适合对计算机体系结构和编译技术有强烈兴趣、喜欢深入底层挖掘性能潜力的工程师

缺点 / 挑战

暂无明显挑战项

角色解读

  • 向AI系统架构师方向发展,主导大规模AI基础设施设计
  • 深耕编译器和底层优化领域,成为高性能计算专家
  • 横向拓展至AI芯片设计或软硬协同优化岗位
  • 深入分析AI推理和训练场景的性能瓶颈,识别软硬件热点问题
  • 利用CPU/GPU架构特点和编译优化技术,联合业务团队进行极致性能调优
  • 设计并导入异构计算方案,进行性能评估与迭代优化
  • 扎实的计算机体系结构、操作系统和编译原理知识
  • 熟悉至少一种AI训练/推理框架(PyTorch或TensorFlow)
  • 具备LLM/NLP/推荐/视觉等场景的优化经验
  • 了解模型或算子编译优化工具(如XLA、Triton)

申请策略

  • 了解字节跳动在AI基础设施方面的业务方向,在面试中体现技术匹配度
  • 准备一个完整的性能优化案例,从问题发现到方案落地的过程
  • 突出在AI模型训练或推理部署中的性能优化项目经验
  • 展示对底层系统(如CPU/GPU架构、编译优化)的理解和实践
  • 提及使用过PyTorch/TensorFlow及性能分析工具(如ncu、perf)的经历
  • 深入学习编译优化技术,如XLA、Triton或TVM
  • 掌握GPU编程(CUDA)和性能分析工具
  • 补充AI框架源码阅读和调优经验

面试指南

  • 对于优化类问题,采用'问题分析-方案设计-实施验证'框架
  • 对于原理类问题,先解释概念再结合实例说明
  • 请描述一次你使用性能分析工具定位并解决AI模型推理瓶颈的经历
  • 解释Transformer模型中self-attention的计算瓶颈,并给出优化思路
  • 对比CPU和GPU在AI推理中的优劣势,并说明如何根据场景选择
  • 什么是算子融合?请举例说明其原理和效果
  • 你对Triton或XLA有哪些了解?如何在实际项目中使用?
  • 复习计算机体系结构、编译原理的核心概念,如缓存、流水线、循环优化

职位点评

64
综合评分

大厂AI底层优化岗,技术前沿成长快,薪资较高但工作强度可能较大。

更适合这类人
适合追求技术成长和前沿挑战、对薪资和稳定性有一定要求但对工作生活平衡不敏感的求职者。
表现最好
成长发展
相对薄弱
工作生活
薪资福利70
成长发展85
工作生活40
使命价值60

薪资福利

70中等

大厂薪资水平较高,但JD未明确具体薪资和福利,补偿性动机满足程度中等偏上。

薪资信号未披露(AI估算:30K-60K/月)

成长发展

85较高

职位涉及前沿AI系统和底层优化,技术成长空间大,满足发展性动机。

技术前沿前沿/新兴技术
技术栈AI计算、编译优化、GPU、CPU架构、XLA、Triton、LLM
业务类型ambiguous

工作生活

40较低

JD未提及弹性工作或远程办公,仅现场办公,且大厂工作强度可能较大,生活化动机满足有限。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值

60中等

AI技术对社会有较大推动,但职位本身偏技术实现,意义感动机中等。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 多媒体处理高级开发工程师

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 招聘专家-广告

    字节跳动 · 北京市
    AI 估算 · 20k-35k
  • 自动化开发专家-TikTok(杭州/上海)

    字节跳动 · 杭州市
    AI 估算 · 35k-65k
  • AI业务研发工程师-TikTok Shop

    字节跳动 · 上海市
    AI 估算 · 25k-50k
  • 平台产品经理(游戏AI方向)-抖音

    字节跳动 · 深圳市
    AI 估算 · 25k-45k

相似职位推荐

  • Student Intern-SYNC

    西门子 · 上海市
    AI 估算 · 4k-6k
  • Advanced Software Engineer-C++

    飞利浦 · 沈阳市
    AI 估算 · 15k-25k
  • Advanced Software Engineer-C++

    飞利浦 · 沈阳市
    AI 估算 · 25k-40k
  • 2027 Campus - Software Development Engineer - Industrial & IoT

    恩智浦半导体 · 北京市
    AI 估算 · 15k-25k
  • 大模型推理部署优化实习生-AI引擎

    米哈游 · 上海市
    AI 估算 · 4k-8k

字节跳动 的其他在招职位

  • 多媒体处理高级开发工程师

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 招聘专家-广告

    字节跳动 · 北京市
    AI 估算 · 20k-35k
  • 自动化开发专家-TikTok(杭州/上海)

    字节跳动 · 杭州市
    AI 估算 · 35k-65k
  • AI业务研发工程师-TikTok Shop

    字节跳动 · 上海市
    AI 估算 · 25k-50k
  • 平台产品经理(游戏AI方向)-抖音

    字节跳动 · 深圳市
    AI 估算 · 25k-45k

相似职位推荐

  • Student Intern-SYNC

    西门子 · 上海市
    AI 估算 · 4k-6k
  • Advanced Software Engineer-C++

    飞利浦 · 沈阳市
    AI 估算 · 15k-25k
  • Advanced Software Engineer-C++

    飞利浦 · 沈阳市
    AI 估算 · 25k-40k
  • 2027 Campus - Software Development Engineer - Industrial & IoT

    恩智浦半导体 · 北京市
    AI 估算 · 15k-25k
  • 大模型推理部署优化实习生-AI引擎

    米哈游 · 上海市
    AI 估算 · 4k-8k