Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
AI异构计算优化专家-Data
立即应聘

AI异构计算优化专家-Data

发布于 大约 17 小时前

普通员工/个人贡献者

北京市
专家级经验
全职员工
仅现场办公
学历未注明
GPU
PyTorch
TensorFlow
CUDA
模型优化
MLIR
AI编译器
异构计算

AI 估算 · 35k–65k

高级异构计算专家,技术稀缺度高,字节跳动大厂薪资竞争力强,参考市场水平

职位详情

关于这个职位

该职位隶属于字节跳动Data AML机器学习中台,负责评估、优化和落地异构计算芯片(如昇腾、寒武纪)在推理和训练场景中的性能

你将开发高性能算子、优化编译器,并与团队探索稀疏计算、存内计算等前沿方向,为抖音、今日头条等核心业务提供算力支持
适合对AI芯片和底层系统优化有浓厚兴趣的高级工程师

最低要求

熟练掌握Linux环境下的C/C++、Python语言

具备扎实的计算机科学功底和编程能力,熟悉常见算法和数据结构,具有良好的编程习惯
能够熟练使用至少一种主流的机器学习框架(TensorFlow/PyTorch等),熟悉框架内部实现
熟悉至少一种经典深度学习模型及其应用场景,如GPT、SD、DiT、W&D等
熟悉至少一种并行计算架构,熟悉其编程模型,并知晓其优、劣所在
有良好的工作文档习惯,及时按要求撰写更新工作流程及技术文档

工作职责

评估:负责评估符合业务要求的异构计算芯片,建立/完善评估体系、负载模型,预估业务收益

推理:负责异构计算芯片落地实际推理业务,适配异构计算芯片特性,降低推理时延,提高推理吞吐
训练:负责异构计算芯片落地实际训练业务,根据芯片计算、通信特性,优化显存占用,提高训练吞吐
算子:负责开发异构计算芯片的高性能算子,根据芯片特性,优化算力、带宽利用率
编译:负责通过编译技术实现异构计算芯片在不同业务场景中落地,负责实现更加高效的异构硬件编程范式
调研:负责调研、验证前沿软硬件结合方向,比如稀疏计算、存内计算、数据流计算等

优先资格

了解昇腾、寒武纪等推理/训练/通信相关优化,有高性能算子、大规模训练、通算融合领域经验者优先

了解SIMD/SIMT外其他并行计算模型及算法,了解其并行编程模型及其优、缺点者优先
了解模型剪枝、量化、LLM投机采样等优化方法原理,具备相关模型优化经验者优先
了解常见AI编译器方案及其优、缺点(如XLA、TVM、MLIR),有实际开发经验者优先
了解GPU硬件架构,了解GPU软件栈(CUDA、CuBLAS、CutLASS),具备GPU性能分析的能力者优先
了解AI Compiler技术栈(MLIR等),熟悉Torch2.0+编译栈、Triton优先者优先

AI 洞察

优缺点分析

  • 深度参与AI芯片前沿技术,积累稀缺的异构计算优化经验,职业壁垒高
  • 字节跳动平台大、业务多,技术落地场景丰富,个人影响力易放大
  • 团队技术氛围浓厚,可接触业界领先的软硬件协同方案
  • 技术深度要求极高,需要同时理解硬件架构、编译器和AI框架,学习曲线陡峭
  • 工作节奏可能较快,需要快速跟进硬件迭代和业务需求变化
  • 岗位对创新能力要求高,需要在不确定的前沿领域探索有效方案
  • 适合对AI芯片底层技术充满热情、具有较强系统优化和编程能力、渴望在高技术壁垒领域深耕的工程师

角色解读

  • 成为AI芯片与优化领域的资深专家,可向技术架构师或团队技术负责人发展
  • 横向拓展至更多硬件平台和AI框架,参与行业标准制定
  • 有机会转岗至公司内其他核心基础设施团队,如推荐引擎、广告系统等
  • 评估和选型异构计算芯片,建立评估体系和负载模型,预估业务收益
  • 将芯片落地到实际推理和训练业务中,优化时延、吞吐和显存占用
  • 开发高性能算子并利用编译技术(如MLIR)实现芯片的高效编程,探索稀疏计算等前沿方向
  • 精通C/C++和Python,具备扎实的计算机科学基础和编程能力
  • 熟悉至少一种深度学习框架(TensorFlow/PyTorch)及其内部实现
  • 掌握至少一种并行计算架构(如GPU/CUDA),了解其编程模型和优劣

申请策略

  • 在简历和面试中强调动手实践能力,多准备项目细节和性能对比数据
  • 关注字节跳动技术博客和开源项目,了解团队的技术方向
  • 突出在GPU或AI芯片上的性能优化经验,包括算子开发、训练/推理加速的具体项目和数据
  • 强调对TensorFlow/PyTorch框架内部机制的理解,可展示修改框架进行性能调优的案例
  • 如果有AI编译器(如MLIR、TVM)或大规模分布式训练经验,务必重点描述
  • 若缺乏国产芯片经验,可提前了解昇腾或寒武纪的基本架构和编程模型
  • 系统学习AI编译器(MLIR、Triton)和模型优化技术(量化、剪枝)
  • 复习CUDA编程和GPU架构知识,提升性能分析能力

面试指南

  • STAR法则:描述情境、任务、行动和结果,突出量化指标
  • 从硬件特性、计算模式、内存访问、并行度等维度分析性能瓶颈
  • 对比不同方案优劣,体现思考深度和工程经验
  • 如何评估一款AI芯片在推理场景下的性能?请设计评估方法
  • 描述一次你使用CUDA优化算子的经历,具体做了哪些优化?
  • Transformer模型在推理时有哪些瓶颈?如何通过硬件/系统优化?
  • 了解MLIR吗?它相比传统编译器有哪些优势?
  • 在大规模分布式训练中,通信优化有哪些常见手段?

匹配度报告

78
综合匹配度

字节跳动核心中台,前沿异构计算优化,高薪资高成长,但工作强度可能较大。

适合人群
最适合追求技术深度和职业成长,不过分强调工作生活平衡的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展95
工作生活50
使命价值80

薪资福利匹配

85较高

薪资方面,字节跳动高级技术岗通常提供具有竞争力的薪酬,但JD未明确具体数额和福利。公司已上市,规模大,稳定性好。

薪资信号未披露 (35K-65K/月)

成长发展匹配

95较高

该岗位位于AI底层优化前沿,技术含量极高,涉及芯片评估、算子开发、编译器、模型优化等多维度。团队是公司核心中台,成长空间巨大。

技术前沿前沿/新兴技术
技术栈异构计算、AI编译、高性能算子、CUDA、MLIR、模型优化、PyTorch、TensorFlow
业务类型profit_center

工作生活匹配

50较低

JD未提及工作模式,互联网大厂通常需现场办公;未明确WLB,技术攻坚型岗位可能加班。

工作模式未明确
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

80较高

职位服务于字节跳动核心业务,技术影响力大,且通过火山引擎赋能外部企业,具有行业价值。AI芯片优化属于国家战略方向,使命感较强。

行业发展高速增长赛道
社会影响正向社会影响力较高
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 游戏关卡策划-绿洲

    字节跳动 · 北京市
    AI 估算 · 20k-40k
  • Android开发工程师-今日头条

    字节跳动 · 北京市
    AI 估算 · 20k-40k
  • AI/大模型网络研发工程师

    字节跳动 · 深圳市
    AI 估算 · 30k-60k
  • 抖音直播服务端核心研发工程师-游戏商业化方向

    字节跳动 · 广州市
    AI 估算 · 25k-45k
  • 大模型Agent研究工程师-Seed

    字节跳动 · 上海市
    AI 估算 · 30k-60k

相似职位推荐

  • 半导体激光器研发工程师

    浪潮 · 济南市
    AI 估算 · 15k-25k
  • 算法工程师(语音合成方向)

    中国平安 · 深圳市
    AI 估算 · 25k-45k
  • TMS Electric Component

    大众汽车 · 合肥市
    AI 估算 · 15k-25k
  • 多模态大模型算法实习生(J97978)

    百度 · 北京市
    AI 估算 · 6k-10k

字节跳动 的其他在招职位

  • 游戏关卡策划-绿洲

    字节跳动 · 北京市
    AI 估算 · 20k-40k
  • Android开发工程师-今日头条

    字节跳动 · 北京市
    AI 估算 · 20k-40k
  • AI/大模型网络研发工程师

    字节跳动 · 深圳市
    AI 估算 · 30k-60k
  • 抖音直播服务端核心研发工程师-游戏商业化方向

    字节跳动 · 广州市
    AI 估算 · 25k-45k
  • 大模型Agent研究工程师-Seed

    字节跳动 · 上海市
    AI 估算 · 30k-60k

相似职位推荐

  • 半导体激光器研发工程师

    浪潮 · 济南市
    AI 估算 · 15k-25k
  • 算法工程师(语音合成方向)

    中国平安 · 深圳市
    AI 估算 · 25k-45k
  • TMS Electric Component

    大众汽车 · 合肥市
    AI 估算 · 15k-25k
  • 多模态大模型算法实习生(J97978)

    百度 · 北京市
    AI 估算 · 6k-10k