Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
AI异构计算优化专家-Data AML
立即应聘

AI异构计算优化专家-Data AML

发布于 大约 2 小时前

普通员工/个人贡献者

北京市
专家级经验
全职员工
仅现场办公
学历未注明
GPU
PyTorch
TensorFlow
编译器
CUDA
MLIR
昇腾
存内计算
稀疏计算
寒武纪

AI 估算 · 50k–80k

高级算法专家岗位,技术壁垒高,字节跳动薪资有竞争力,结合北京市场行情。

职位详情

关于这个职位

该职位主要负责评估和优化异构计算芯片(如昇腾、寒武纪等),将其落地到实际的训练和推理业务中,开发高性能算子,并通过编译技术提升计算效率

你将与机器学习中台团队合作,为字节跳动的核心业务提供算力支持,并探索前沿的软硬件结合技术
适合对AI芯片、高性能计算和系统优化有深入理解的工程师

最低要求

熟练掌握Linux环境下的C/C++、Python语言

具备扎实的计算机科学功底和编程能力,熟悉常见算法和数据结构,具有良好的编程习惯
能够熟练使用至少一种主流的机器学习框架(TensorFlow/PyTorch等),熟悉框架内部实现
熟悉至少一种经典深度学习模型及其应用场景,如GPT、SD、DiT、W&D等
熟悉至少一种并行计算架构,熟悉其编程模型,并知晓其优、劣所在
有良好的工作文档习惯,及时按要求撰写更新工作流程及技术文档

工作职责

评估:负责评估符合业务要求的异构计算芯片,建立/完善评估体系、负载模型,预估业务收益

推理:负责异构计算芯片落地实际推理业务,适配异构计算芯片特性,降低推理时延,提高推理吞吐
训练:负责异构计算芯片落地实际训练业务,根据芯片计算、通信特性,优化显存占用,提高训练吞吐
算子:负责开发异构计算芯片的高性能算子,根据芯片特性,优化算力、带宽利用率
编译:负责通过编译技术实现异构计算芯片在不同业务场景中落地,负责实现更加高效的异构硬件编程范式
调研:负责调研、验证前沿软硬件结合方向,比如稀疏计算(Sparse Computation)、存内计算(In-Memory Computing)、数据流计算(DataFlow)等

优先资格

了解昇腾、寒武纪等推理/训练/通信相关优化,有高性能算子、大规模训练、通算融合领域经验者优先

了解SIMD/SIMT外其他并行计算模型及算法,了解其并行编程模型及其优、缺点者优先
了解模型剪枝、量化、LLM投机采样等优化方法原理,具备相关模型优化经验者优先
了解常见AI编译器方案及其优、缺点(如XLA、TVM、MLIR),有实际开发经验者优先
了解GPU硬件架构,了解GPU软件栈(CUDA、cuBLAS、cuTLASS),具备GPU性能分析的能力者优先
了解AI Compiler技术栈(MLIR等),熟悉Torch2.0+编译栈、Triton优秀者优先

AI 洞察

优缺点分析

优点

  • 团队(AML)是公司机器学习中台,技术氛围浓厚,与业界顶尖人才共事
  • 薪资待遇优厚,晋升通道明确,股票激励等福利可观
  • 技术门槛高,需要同时掌握硬件、编译器和算法知识,学习曲线陡峭
  • 需要持续跟踪快速发展的AI芯片和编译器生态,保持技术更新
  • 适合对底层系统优化有强烈兴趣、具备扎实的计算机基础且愿意深耕异构计算的技术极客

缺点 / 挑战

  • 字节跳动平台大,业务场景丰富,技术挑战性强,能接触到前沿的AI芯片和系统优化
  • 工作强度较大,字节跳动普遍有较高的工作节奏和压力

角色解读

  • 在技术纵深上,可成为异构计算/高性能计算领域的顶尖专家
  • 横向可扩展至AI编译器、芯片设计等方向,或转向技术管理岗位
  • 字节跳动内部提供丰富的业务场景和算力资源,成长空间大
  • 评估和选型异构计算芯片,建立评估体系和负载模型,预测业务收益
  • 将芯片落地到实际推理和训练业务,优化延迟和吞吐,包括算子开发和编译技术
  • 跟踪前沿软硬件结合方向,如稀疏计算、存内计算等,进行技术预研
  • 精通C/C++和Python,具备扎实的计算机科学基础和编程能力
  • 熟悉至少一种主流深度学习框架(如PyTorch/TensorFlow)及其内部实现
  • 掌握至少一种并行计算架构(如GPU/CUDA),了解其编程模型及优劣

申请策略

  • 在简历中量化你的优化成果,如延迟降低百分比、吞吐提升倍数
  • 了解字节跳动AML团队的技术博客和开源项目,展示你对团队的关注
  • 突出与GPU/CUDA、AI编译器(如MLIR、TVM)、高性能算子开发相关的项目经验
  • 展示对深度学习模型(如GPT、DiT)的优化案例,包括量化、剪枝、推理加速等
  • 强调C/C++和Python的编程能力,最好有大型系统或高性能库的开发经历
  • 补充对昇腾、寒武纪等国产芯片的编程模型和优化方法的学习
  • 深入掌握MLIR、Triton等编译器技术,了解Torch2.0编译栈
  • 实践模型压缩和加速技术,如量化、知识蒸馏、稀疏计算等

面试指南

  • 对于优化类问题:先明确目标和约束,分析瓶颈(计算/内存/通信),提出多种方案并评估权衡,最后给出具体实现和效果
  • 对于编译器类问题:从高层IR到后端代码生成,讲清楚pipeline和关键技术,结合具体案例
  • 对于前沿问题:展现你的技术视野和思考深度,能指出优缺点和应用场景
  • 请详细解释CUDA编程模型以及如何优化一个矩阵乘法的kernel
  • 描述你如何将一个PyTorch模型部署到异构芯片上,并优化推理性能
  • 分析MLIR和TVM的区别和适用场景,以及你如何利用它们进行代码生成
  • 介绍一个你做过的高性能算子实现,包括如何利用硬件特性
  • 如何看待存内计算和稀疏计算在未来AI芯片中的地位?

匹配度报告

72
综合匹配度

高薪高成长、技术前沿,但工作强度大,WLB一般。

适合人群
适合追求技术成长和高薪回报,能接受高强度工作节奏的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展90
工作生活40
使命价值75

薪资福利匹配

85较高

字节跳动提供极具竞争力的薪酬和福利(包括股票期权),薪资水平在行业内属于顶尖水平,满足高补偿性动机。

薪资信号偏高 (50K-80K/月)

成长发展匹配

90较高

该职位涉及前沿技术和复杂系统,能极大提升技术深度和广度,字节跳动内部有丰富的培训资源和晋升通道,发展性动机高度满足。

技术前沿前沿/新兴技术
技术栈C/C++、Python、TensorFlow、PyTorch、CUDA、MLIR、Triton、稀疏计算、存内计算
业务类型profit_center

工作生活匹配

40较低

字节跳动工作节奏较快,通常要求弹性加班,且办公地点在北京核心区域,生活化动机满足程度较低。JD中未提及远程或弹性工作。

工作模式仅现场办公
办公地点市区核心地段
加班情况明确要求弹性/高强度

使命价值匹配

75中等

职位服务于字节跳动核心业务,技术影响力大,但社会价值相对中性(消费互联网),并非直接以社会使命为导向。

行业发展高速增长赛道
社会影响中性/一般
创新程度开拓性创新(行业首创)
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 增长算法工程师-抖音直播

    字节跳动 · 北京市
    AI 估算 · 30k-60k
  • 用户产品经理(同城Tab方向)-TikTok生活服务

    字节跳动 · 上海市
    AI 估算 · 15k-25k
  • 推荐算法专家-抖音推荐技术

    字节跳动 · 北京市
    AI 估算 · 35k-55k
  • 服务器装备测试/Diag 工程师

    字节跳动 · 北京市
    AI 估算 · 30k-50k
  • 服务器硬件研发维护专家-Data

    字节跳动 · 深圳市
    AI 估算 · 30k-50k

相似职位推荐

  • 【快Star】多模态理解算法研究员

    快手 · 深圳市
    AI 估算 · 25k-45k
  • 【快Star】具身智能算法研究员

    快手 · 北京市
    AI 估算 · 30k-50k
  • 【快Star】搜索大模型算法工程师

    快手 · 杭州市
    AI 估算 · 30k-60k
  • 【快Star】多模态理解与生成算法研究员

    快手 · 北京市
    AI 估算 · 35k-60k
  • 【快Star】视频大模型高性能与低精度算子工程师

    快手 · 上海市
    AI 估算 · 35k-60k

字节跳动 的其他在招职位

  • 增长算法工程师-抖音直播

    字节跳动 · 北京市
    AI 估算 · 30k-60k
  • 用户产品经理(同城Tab方向)-TikTok生活服务

    字节跳动 · 上海市
    AI 估算 · 15k-25k
  • 推荐算法专家-抖音推荐技术

    字节跳动 · 北京市
    AI 估算 · 35k-55k
  • 服务器装备测试/Diag 工程师

    字节跳动 · 北京市
    AI 估算 · 30k-50k
  • 服务器硬件研发维护专家-Data

    字节跳动 · 深圳市
    AI 估算 · 30k-50k

相似职位推荐

  • 【快Star】多模态理解算法研究员

    快手 · 深圳市
    AI 估算 · 25k-45k
  • 【快Star】具身智能算法研究员

    快手 · 北京市
    AI 估算 · 30k-50k
  • 【快Star】搜索大模型算法工程师

    快手 · 杭州市
    AI 估算 · 30k-60k
  • 【快Star】多模态理解与生成算法研究员

    快手 · 北京市
    AI 估算 · 35k-60k
  • 【快Star】视频大模型高性能与低精度算子工程师

    快手 · 上海市
    AI 估算 · 35k-60k