
字节跳动
AI性能优化专家-火山引擎
AI性能优化专家-火山引擎
发布于 大约 1 小时前普通员工/个人贡献者
北京市
高级经验
全职员工
仅现场办公
学历未注明
分布式系统
PyTorch
性能优化
GO
TensorFlow
LLM
AIGC
异构计算
AI 估算 · 35k–60k
高级AI性能优化岗位,技术难度高,字节跳动大厂,薪资有竞争力。
职位详情
关于这个职位
作为火山引擎AI性能优化专家,您将专注于IaaS异构云产品的性能调优,重点提升大模型训练和推理效率,构建通用软件加速方案,并协助客户挖掘硬件潜力
该职位要求扎实的分布式系统开发经验,深入理解AI框架与异构计算,适合技术功底深厚、追求高性能计算挑战的工程师
最低要求
熟练掌握Linux环境下的C/C++、Python、Go语言,有分布式系统软件开发和调试经验
熟悉LLM/CV/NLP/推荐系统等业务场景的系统和原理
有主流深度学习框架(如TensorFlow、PyTorch等)相关开发经验,掌握框架任一组件的代码实现
掌握异构计算、网络、存储的性能分析工具和相关原理,有软硬协同优化经验
工作职责
负责AI Infra的性能分析,构建性能标尺和竞争力模型
负责基于云上AIGC等业务场景的性能分析以及训练、推理场景的底层优化工作
负责云上IaaS 国产加速器在AI场景的引入、落地和优化工作
优先资格
熟悉主要云厂商的AI Infra解决方案
在LLM训练或推理性能优化方面有实操经验
有模型量化和业务模型精度调优经验
有TensorRT/CUTLASS/Trition等开发经验和性能优化经验
熟悉国产AI加速卡生态,有实际场景的应用经验
AI 洞察
优缺点分析
优点
- 聚焦前沿AI技术(大模型、AIGC),技术成长快,行业前景广阔
- 字节跳动大厂平台,资源丰富,有机会接触大规模真实业务场景
- 职位技术含量高,对个人能力提升显著,且在云厂商中具有战略价值
- 技术深度和广度要求极高,需要同时掌握底层系统、AI框架和硬件知识
- 工作节奏可能较快,面对不断演进的AI模型需要持续学习和快速迭代
- 适合技术功底扎实、对性能极致追求、乐于在AI基础设施领域深耕的工程师
缺点 / 挑战
- 优化工作常涉及跨团队协作,沟通成本较高
角色解读
- 技术深耕:成为AI基础设施性能优化领域的专家,主导大规模集群优化方案
- 架构演进:转向AI Infra架构师角色,设计下一代高性能计算平台
- 管理路线:带领性能优化团队,负责核心项目的技术决策和团队建设
- 深入分析AI Infra性能瓶颈,构建性能标尺和竞争力模型,为优化提供数据驱动依据
- 针对云上AIGC场景,进行训练和推理的底层优化,提升吞吐量并降低延迟
- 引入并优化国产AI加速器,与硬件协同工作,充分发挥异构计算潜力
- 精通C/C++、Python、Go,具备分布式系统开发调试能力
- 深入理解LLM/CV/NLP等AI业务场景,熟悉主流深度学习框架(如PyTorch、TensorFlow)的实现
- 掌握异构计算、网络、存储的性能分析工具,有软硬协同优化经验
申请策略
- 准备一份详细的性能优化案例集,说明问题、方法、效果和思考过程
- 了解火山引擎IaaS产品线和AI Infra整体架构,在面试中展现业务理解
- 突出分布式系统性能优化的项目经验,尤其是涉及大量数据传输或异构计算的部分
- 强调对AI框架(PyTorch/TensorFlow)底层实现的掌握,如自定义算子、内存优化等
- 展示在LLM训练或推理优化方面的具体成果,例如显存节省、吞吐提升等量化指标
- 若缺乏国产加速器经验,可提前了解华为昇腾、寒武纪等生态,并动手实践
- 补充TensorRT/CUTLASS等底层加速库的使用经验,可通过开源项目练习
面试指南
- 针对性能优化问题,先明确场景和瓶颈指标(吞吐、延迟、显存等),再通过性能分析工具定位根因,最后给出具体优化方案并验证效果
- 对于框架底层问题,从计算图、算子实现、内存管理、通信等多维度展开
- 注重软硬协同,考虑硬件特性如Tensor Core、共享内存等
- 请描述一次你优化分布式训练性能的经历,遇到了哪些瓶颈,如何解决的?
- 谈谈你对LLM推理加速的理解,有哪些常用技术(如量化、剪枝、KV cache优化)?
- 如何分析一个GPU训练任务中的性能瓶颈?请举例说明你常用的工具和方法
- 对于国产AI加速卡(如昇腾),你认为在软件生态方面还需要哪些改进?
- 在PyTorch中,如何实现一个自定义算子并对其性能进行优化?
匹配度报告
69
综合匹配度
大厂AI性能优化岗位,前沿技术栈,高薪但工作强度大,WLB一般。
适合人群
适合追求技术成长、不在意加班和地点灵活性的高性能计算工程师。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利80
成长发展85
工作生活40
使命价值70
薪资福利匹配
80较高
字节跳动薪资竞争力强,但JD未明确福利,综合判断薪酬方面吸引力较高。
薪资信号偏高 (35K-60K/月)
成长发展匹配
85较高
职位涉及前沿AI技术和大型云平台,技能成长空间大,但JD未提及明确晋升通道。
技术前沿前沿/新兴技术
技术栈LLM、AIGC、异构计算、国产加速器、TensorRT
业务类型profit_center
工作生活匹配
40较低
工作地点在北京且要求现场办公,JD未提弹性或WLB,互联网大厂通常节奏较快。
工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)
使命价值匹配
70中等
AI基础设施优化对行业有推动作用,但社会影响力相对中性。
行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
字节跳动 的其他在招职位
相似职位推荐
Watch Jobs