
字节跳动
机器学习编译优化工程师-Seed
机器学习编译优化工程师-Seed
发布于 大约 17 小时前普通员工/个人贡献者
北京市
高级经验
全职员工
仅现场办公
学历未注明
性能优化
GPU优化
深度学习框架
ML编译器
XLA
MLIR
CPU优化
TVM
计算图优化
AI 估算 · 35k–55k
市场稀缺的AI编译优化岗位,字节跳动薪酬竞争力强,技能难度高,高级工程师薪资处于行业领先水平。
职位详情
关于这个职位
该职位是字节跳动Seed团队的核心技术岗位,负责AI编译器的设计与优化,提升搜索/推荐/广告场景下模型训练和推理的计算效率
你将与算法部门深度合作,针对大规模系统进行软硬件协同优化,适合对编译技术和AI系统性能有浓厚兴趣的工程师
最低要求
熟悉开源ML编译器代码(如XLA/MLIR/TVM),并有相关开发经验
具有CPU/GPU下的算子Kernel开发和性能优化经验
具有扎实的C/C++编程能力和数据结构和算法知识
具有独立解决问题的能力,能够对业务逻辑进行合理的抽象和拆分,良好的团队合作精神
工作职责
参与AI编译器相关项目的技术方案规划,设计在离线全系统的计算图优化链路
针对搜索/推荐/广告场景,优化模型训练/推理的计算图执行效率
与全公司算法部门深度合作,为重点项目进行算法与系统的联合优化
优先资格
有软硬件联合设计的经验
深入研究过至少一种机器学习框架(TensorFlow/PyTorch/MXNet或其他自研框架)的底层架构和机制
AI 洞察
优缺点分析
- 参与AI前沿技术研发,接触大规模分布式训练和推理系统
- 字节跳动核心团队,资源丰富,技术影响力大
- 项目具有极高的技术挑战性,能快速提升系统优化能力
- 薪资和福利具有市场竞争力,职业发展前景广阔
- 技术难度高,需要跨编译器、硬件、算法等多领域知识
- 工作强度较大,可能需要应对紧急的性能优化任务
- 团队内竞争激烈,对自我驱动力和学习速度要求高
- 适合对底层编译技术和AI系统优化有强烈兴趣,乐于解决高难度问题,追求技术深度和职业成长的工程师
角色解读
- 成为AI系统优化专家,主导编译器核心模块的设计与实现
- 向AI编译器架构师发展,负责全局计算图优化策略的规划
- 深入算法与硬件协同设计领域,参与软硬件联合创新项目
- 设计AI编译器的计算图优化方案,提升模型训练和推理的效率
- 针对GPU/CPU进行算子Kernel开发和性能调优
- 与算法团队紧密合作,对搜索/推荐/广告等业务场景进行联合优化
- 精通ML编译器框架(XLA/MLIR/TVM),具有相关开发经验
- 深入掌握CPU/GPU编程和性能优化,特别是CUDA Kernel开发
- 扎实的C/C++编程能力,熟悉数据结构和算法
- 良好的问题分析和独立解决能力,能抽象和拆解复杂业务逻辑
申请策略
- 了解字节跳动AI基础设施和业务场景(搜索、推荐、广告),在面试中展现对业务需求的理解
- 准备一个完整的编译器优化项目案例,从问题识别到方案落地和效果评估
- 突出ML编译器(XLA/MLIR/TVM)相关的项目经验,展示具体贡献
- 量化性能优化成果,如加速比、延迟降低百分比等
- 强调C/C++和GPU编程能力,附上开源项目或Kernel代码链接
- 展示独立解决复杂问题的案例,特别是与算法团队协作的经历
- 深入学习MLIR或TVM的源码结构,理解其编译流程
- 练习CUDA Kernel优化,如矩阵乘法、卷积等算子的手工调优
面试指南
- 回答时可以分要点,先说明背景和问题,再阐述你的解决方案和实现细节,最后展示性能对比和量化结果
- 对于开放性问题,采用“问题分析-方案设计-实施验证”的结构,体现系统性思维
- 遇到不确定的问题,可以坦诚表示需要更深入思考,但给出你的推理方向
- 请解释XLA的计算图优化流程,并举例说明算子融合的原理
- 如何优化一个GPU Kernel的性能?请描述你的调优步骤
- 描述你在ML编译器项目中的具体贡献,遇到了什么挑战?
- 如何处理计算图中的动态形状问题?
- 你对TensorFlow或PyTorch的底层执行机制了解多少?比如Eager Execution和Graph模式的区别
匹配度报告
75
综合匹配度
大厂核心团队,前沿AI编译器技术栈,薪资优厚,但工作强度大,WLB一般。
适合人群
追求技术成长和职业发展,愿意投入高强度工作,对AI底层技术有热情的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展95
工作生活40
使命价值80
薪资福利匹配
85较高
字节跳动提供有竞争力的薪酬和福利,但工作强度大,且JD未明确薪资和福利,补偿性动机满足度较高但有限。
薪资信号未披露 (35K-55K/月)
成长发展匹配
95较高
该职位处于AI编译优化前沿,技术深度和广度兼备,成长空间极大,发展性动机得到高度满足。
技术前沿前沿/新兴技术
技术栈ML编译器、XLA、MLIR、TVM、CUDA、GPU
业务类型profit_center
工作生活匹配
40较低
仅现场办公,未提及弹性工作,且互联网大厂普遍加班文化,生活化动机满足度较低。
工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)
使命价值匹配
80较高
参与通用智能研究,推动AI技术发展,使命感和行业前景好,但JD未明确社会价值关键词。
行业发展高速增长赛道
社会影响正向社会影响力较高
创新程度开拓性创新(行业首创)
字节跳动 的其他在招职位
相似职位推荐
Watch Jobs