Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

ByteDance logo
字节跳动
性能优化工程师(AI计算方向)-基础库与工具链
立即应聘

性能优化工程师(AI计算方向)-基础库与工具链

发布于 大约 11 小时前

普通员工/个人贡献者

上海市
中级经验
全职员工
仅现场办公
学历未注明
软件工程
GPU
PyTorch
性能优化
TensorFlow
LLM
XLA
CPU
AI计算
编译优化

AI 估算 · 30k–60k

字节跳动为一线大厂,AI性能优化岗位技术门槛高,竞争激烈,薪资通常高于市场平均水平,估算月薪3-6万。

职位详情

关于这个职位

该职位专注于AI计算领域的性能优化,包括在离线推理和训练场景中分析业务特点、识别瓶颈并实施优化

你将利用CPU、GPU、AI加速器等硬件特性,结合编译、操作系统、高性能库等底层技术,与业务团队协作,极致提升模型性能
适合对计算机体系结构、编译优化有深入理解,并有AI框架优化经验的工程师

最低要求

了解计算机体系结构、操作系统原理、编译原理、计算机网络中的基本概念和原理

任一场景,LLM/NLP/推荐/视觉/语音下的训练、推理部署优化相关实践经验
熟悉一种AI模型训练或推理框架(PyTorch或者Tensorflow)

工作职责

观测和分析在离线推理和训练场景的业务特点,例如软件热点,硬件瓶颈等,提出优化方案

利用通用CPU(如ARM、X86、RISC-V等)、GPU、AI加速器架构特点、结合编译/操作系统/高性能库等底层软件技术,联合业务团队,极致优化指定业务性能
导入异构卡构建/编译方案,适配业务场景,并进行性能评估

优先资格

了解AI场景的模型/算子编译优化(例如Xla/Torch.Compile/Triton)优先

有性能评估/预估,算子性能优化、AI计算软硬件协同设计相关实践经验者优先

AI 洞察

优缺点分析

优点

  • 接触前沿AI计算技术,如LLM、GPU优化、编译栈,技术成长快
  • 字节跳动平台大,资源丰富,优化成果能影响亿级用户产品
  • 团队技术氛围浓厚,与业界顶尖工程师合作,个人价值提升显著
  • 工作强度较大,可能涉及紧急线上性能问题,需要快速响应
  • 技术迭代快,需要持续学习新框架和硬件架构

缺点 / 挑战

  • 性能优化工作挑战高,需要深入理解硬件和软件栈,问题排查难度大
  • 适合对计算机底层技术充满热情,喜欢钻研性能瓶颈,有较强动手能力和问题解决能力的工程师

角色解读

  • 在该岗位可深入AI基础设施底层技术,成为AI系统优化专家
  • 未来可向AI芯片架构师、编译器高级工程师或AI平台技术负责人发展
  • 字节跳动内部技术栈丰富,可横向扩展至其他高性能计算或AI框架研发方向
  • 分析AI模型在训练和推理中的性能瓶颈,包括软件热点和硬件限制,提出优化方案
  • 利用CPU、GPU、AI加速器特性,结合编译、操作系统、高性能库等技术,进行深度性能优化
  • 设计异构卡构建和编译方案,适配不同业务场景,并进行性能评估
  • 扎实的计算机体系结构、操作系统、编译原理和计算机网络知识
  • 具备AI模型训练或推理的优化经验,熟悉PyTorch或TensorFlow
  • 了解模型/算子编译优化工具如XLA、Torch.Compile、Triton等

申请策略

  • 准备一个完整的性能优化案例,从分析瓶颈到实施优化,量化成果
  • 关注字节跳动技术博客和开源项目,了解团队技术方向
  • 突出AI训练/推理优化项目经验,具体说明性能提升指标(如延迟、吞吐量)
  • 强调对PyTorch、TensorFlow等框架的深入理解,以及编译优化工具的使用
  • 展示计算机体系结构、操作系统相关论文或专利,或开源贡献
  • 熟悉XLA、Triton、TVM等编译优化框架,动手实践算子优化
  • 了解最新GPU架构(如NVIDIA H100、AMD MI300)和AI加速器特性
  • 补充性能分析工具(如perf、Nsight、VTune)的使用经验

面试指南

  • STAR法则:描述情境、任务、行动和结果,量化性能提升
  • 分层次回答:从算法层、框架层、编译层、硬件层逐步分析优化方向
  • 对比不同方案:说明为什么选择某种优化技术,权衡利弊
  • 请描述一个你曾经优化AI模型性能的案例,包括瓶颈分析和优化方法
  • 解释一下XLA和Triton的工作原理,以及它们如何加速模型推理?
  • 你如何理解软硬件协同设计?请举例说明
  • 在Linux中,如何分析一个进程的CPU缓存命中率和内存带宽?
  • 如何优化一个Transformer模型的推理延迟?请列出可能的优化点

职位点评

70
综合评分

技术前沿、薪资优厚、成长飞快的AI性能优化岗,但工作强度大、WLB较差。

更适合这类人
最适合追求技术深度和职业发展的求职者,对工作生活平衡要求不高的人。
表现最好
成长发展
相对薄弱
工作生活
薪资福利80
成长发展90
工作生活40
使命价值70

薪资福利

80较高

字节跳动作为一线互联网大厂,薪资福利具有竞争力,该岗位为技术核心岗,薪酬水平偏高,但JD未明确福利细节。

薪资信号偏高 (30K-60K/月)

成长发展

90较高

岗位技术前沿,涉及AI编译、GPU优化、LLM等,成长空间大,但JD未明确提到晋升通道。

技术前沿前沿/新兴技术
技术栈LLM、GPU、XLA、Triton、编译优化、AI加速器
业务类型ambiguous

工作生活

40较低

字节跳动以高强度工作文化著称,JD未提及WLB,工作地点上海,推测以现场办公为主,生活化动机满足度较低。

工作模式仅现场办公
办公地点市区核心地段
加班情况明确要求弹性/高强度

使命价值

70中等

AI性能优化对提升产品体验和行业技术发展有积极影响,但JD未强调社会价值,属于中性偏正面。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 多媒体处理高级开发工程师

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 招聘专家-广告

    字节跳动 · 北京市
    AI 估算 · 20k-35k
  • 自动化开发专家-TikTok(杭州/上海)

    字节跳动 · 杭州市
    AI 估算 · 35k-65k
  • AI业务研发工程师-TikTok Shop

    字节跳动 · 上海市
    AI 估算 · 25k-50k
  • 平台产品经理(游戏AI方向)-抖音

    字节跳动 · 深圳市
    AI 估算 · 25k-45k

相似职位推荐

  • Student Intern-SYNC

    西门子 · 上海市
    AI 估算 · 4k-6k
  • Advanced Software Engineer-C++

    飞利浦 · 沈阳市
    AI 估算 · 15k-25k
  • Advanced Software Engineer-C++

    飞利浦 · 沈阳市
    AI 估算 · 25k-40k
  • 2027 Campus - Software Development Engineer - Industrial & IoT

    恩智浦半导体 · 北京市
    AI 估算 · 15k-25k
  • 大模型推理部署优化实习生-AI引擎

    米哈游 · 上海市
    AI 估算 · 4k-8k

字节跳动 的其他在招职位

  • 多媒体处理高级开发工程师

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 招聘专家-广告

    字节跳动 · 北京市
    AI 估算 · 20k-35k
  • 自动化开发专家-TikTok(杭州/上海)

    字节跳动 · 杭州市
    AI 估算 · 35k-65k
  • AI业务研发工程师-TikTok Shop

    字节跳动 · 上海市
    AI 估算 · 25k-50k
  • 平台产品经理(游戏AI方向)-抖音

    字节跳动 · 深圳市
    AI 估算 · 25k-45k

相似职位推荐

  • Student Intern-SYNC

    西门子 · 上海市
    AI 估算 · 4k-6k
  • Advanced Software Engineer-C++

    飞利浦 · 沈阳市
    AI 估算 · 15k-25k
  • Advanced Software Engineer-C++

    飞利浦 · 沈阳市
    AI 估算 · 25k-40k
  • 2027 Campus - Software Development Engineer - Industrial & IoT

    恩智浦半导体 · 北京市
    AI 估算 · 15k-25k
  • 大模型推理部署优化实习生-AI引擎

    米哈游 · 上海市
    AI 估算 · 4k-8k