ByteDance logo
字节跳动
AI性能优化专家-火山引擎

AI性能优化专家-火山引擎

发布于 大约 1 小时前

普通员工/个人贡献者

北京市
高级经验
全职员工
仅现场办公
学历未注明
分布式系统
PyTorch
性能优化
GO
TensorFlow
LLM
AIGC
异构计算

AI 估算 · 35k–60k

高级AI性能优化岗位,技术难度高,字节跳动大厂,薪资有竞争力。

职位详情

关于这个职位

作为火山引擎AI性能优化专家,您将专注于IaaS异构云产品的性能调优,重点提升大模型训练和推理效率,构建通用软件加速方案,并协助客户挖掘硬件潜力

该职位要求扎实的分布式系统开发经验,深入理解AI框架与异构计算,适合技术功底深厚、追求高性能计算挑战的工程师

最低要求

熟练掌握Linux环境下的C/C++、Python、Go语言,有分布式系统软件开发和调试经验

熟悉LLM/CV/NLP/推荐系统等业务场景的系统和原理
有主流深度学习框架(如TensorFlow、PyTorch等)相关开发经验,掌握框架任一组件的代码实现
掌握异构计算、网络、存储的性能分析工具和相关原理,有软硬协同优化经验

工作职责

负责AI Infra的性能分析,构建性能标尺和竞争力模型

负责基于云上AIGC等业务场景的性能分析以及训练、推理场景的底层优化工作
负责云上IaaS 国产加速器在AI场景的引入、落地和优化工作

优先资格

熟悉主要云厂商的AI Infra解决方案

在LLM训练或推理性能优化方面有实操经验
有模型量化和业务模型精度调优经验
有TensorRT/CUTLASS/Trition等开发经验和性能优化经验
熟悉国产AI加速卡生态,有实际场景的应用经验

AI 洞察

优缺点分析

优点

  • 聚焦前沿AI技术(大模型、AIGC),技术成长快,行业前景广阔
  • 字节跳动大厂平台,资源丰富,有机会接触大规模真实业务场景
  • 职位技术含量高,对个人能力提升显著,且在云厂商中具有战略价值
  • 技术深度和广度要求极高,需要同时掌握底层系统、AI框架和硬件知识
  • 工作节奏可能较快,面对不断演进的AI模型需要持续学习和快速迭代
  • 适合技术功底扎实、对性能极致追求、乐于在AI基础设施领域深耕的工程师

缺点 / 挑战

  • 优化工作常涉及跨团队协作,沟通成本较高

角色解读

  • 技术深耕:成为AI基础设施性能优化领域的专家,主导大规模集群优化方案
  • 架构演进:转向AI Infra架构师角色,设计下一代高性能计算平台
  • 管理路线:带领性能优化团队,负责核心项目的技术决策和团队建设
  • 深入分析AI Infra性能瓶颈,构建性能标尺和竞争力模型,为优化提供数据驱动依据
  • 针对云上AIGC场景,进行训练和推理的底层优化,提升吞吐量并降低延迟
  • 引入并优化国产AI加速器,与硬件协同工作,充分发挥异构计算潜力
  • 精通C/C++、Python、Go,具备分布式系统开发调试能力
  • 深入理解LLM/CV/NLP等AI业务场景,熟悉主流深度学习框架(如PyTorch、TensorFlow)的实现
  • 掌握异构计算、网络、存储的性能分析工具,有软硬协同优化经验

申请策略

  • 准备一份详细的性能优化案例集,说明问题、方法、效果和思考过程
  • 了解火山引擎IaaS产品线和AI Infra整体架构,在面试中展现业务理解
  • 突出分布式系统性能优化的项目经验,尤其是涉及大量数据传输或异构计算的部分
  • 强调对AI框架(PyTorch/TensorFlow)底层实现的掌握,如自定义算子、内存优化等
  • 展示在LLM训练或推理优化方面的具体成果,例如显存节省、吞吐提升等量化指标
  • 若缺乏国产加速器经验,可提前了解华为昇腾、寒武纪等生态,并动手实践
  • 补充TensorRT/CUTLASS等底层加速库的使用经验,可通过开源项目练习

面试指南

  • 针对性能优化问题,先明确场景和瓶颈指标(吞吐、延迟、显存等),再通过性能分析工具定位根因,最后给出具体优化方案并验证效果
  • 对于框架底层问题,从计算图、算子实现、内存管理、通信等多维度展开
  • 注重软硬协同,考虑硬件特性如Tensor Core、共享内存等
  • 请描述一次你优化分布式训练性能的经历,遇到了哪些瓶颈,如何解决的?
  • 谈谈你对LLM推理加速的理解,有哪些常用技术(如量化、剪枝、KV cache优化)?
  • 如何分析一个GPU训练任务中的性能瓶颈?请举例说明你常用的工具和方法
  • 对于国产AI加速卡(如昇腾),你认为在软件生态方面还需要哪些改进?
  • 在PyTorch中,如何实现一个自定义算子并对其性能进行优化?

匹配度报告

69
综合匹配度

大厂AI性能优化岗位,前沿技术栈,高薪但工作强度大,WLB一般。

适合人群
适合追求技术成长、不在意加班和地点灵活性的高性能计算工程师。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利80
成长发展85
工作生活40
使命价值70

薪资福利匹配

80较高

字节跳动薪资竞争力强,但JD未明确福利,综合判断薪酬方面吸引力较高。

薪资信号偏高 (35K-60K/月)

成长发展匹配

85较高

职位涉及前沿AI技术和大型云平台,技能成长空间大,但JD未提及明确晋升通道。

技术前沿前沿/新兴技术
技术栈LLM、AIGC、异构计算、国产加速器、TensorRT
业务类型profit_center

工作生活匹配

40较低

工作地点在北京且要求现场办公,JD未提弹性或WLB,互联网大厂通常节奏较快。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

70中等

AI基础设施优化对行业有推动作用,但社会影响力相对中性。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs