Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
AI异构计算优化专家-火山方舟
立即应聘

AI异构计算优化专家-火山方舟

发布于 大约 14 小时前

普通员工/个人贡献者

杭州市
高级经验
全职员工
仅现场办公
学历未注明
GPU
PyTorch
性能优化
TensorFlow
LLM
CUDA
并行计算
MLIR
AI编译器
异构计算

AI 估算 · 30k–60k

字节跳动高级技术专家岗位,技能要求高且稀缺,杭州薪资水平较高,市场竞争力强。

职位详情

关于这个职位

该职位是字节跳动火山方舟团队的AI异构计算优化专家,负责评估和优化异构计算芯片,涵盖推理与训练优化、高性能算子开发、编译技术落地以及前沿技术调研

需要扎实的C/C++、Python和深度学习框架基础,熟悉GPU架构和并行计算,适合热衷于底层系统优化和硬件加速的技术专家

最低要求

熟练掌握Linux环境下的C/C++、Python语言

具备扎实的计算机科学功底和编程能力,熟悉常见算法和数据结构,具有良好的编程习惯
能够熟练使用至少一种主流的机器学习框架(TensorFlow/PyTorch等),熟悉框架内部实现
熟悉至少一种经典深度学习模型及其应用场景,如GPT、SD、DiT、W&D等
熟悉至少一种并行计算架构,熟悉其编程模型,并知晓其优、劣所在
有良好的工作文档习惯,及时按要求撰写更新工作流程及技术文档

工作职责

评估:负责评估符合业务要求的异构计算芯片,建立/完善评估体系、负载模型,预估业务收益

推理与训练优化:
)负责异构计算芯片落地实际推理业务,适配异构计算芯片特性,降低推理时延,提高推理吞吐
)负责异构计算芯片落地实际训练业务,根据芯片计算、通信特性,优化显存占用,提高训练吞吐
算子开发:负责开发异构计算芯片的高性能算子,根据芯片特性,优化算力、带宽利用率
编译技术落地:负责通过编译技术实现异构计算芯片在不同业务场景中落地,负责实现更加高效的异构硬件编程范式
前沿技术调研:负责调研、验证前沿软硬件结合方向,比如稀疏计算(Sparse Computation)、存内计算(In-Memory Computing)、数据流计算(DataFlow)等

优先资格

了解昇腾、寒武纪等推理/训练/通信相关优化,有高性能算子、大规模训练、通算融合领域经验者优先

了解SIMD/SIMT外其他并行计算模型及算法,了解其并行编程模型及其优、缺点者优先
了解模型剪枝、量化、LLM投机采样等优化方法原理,具备相关模型优化经验者优先
了解常见AI编译器方案及其优、缺点(如XLA、TVM、MLIR),有实际开发经验者优先
了解GPU硬件架构,了解GPU软件栈(CUDA、cuBLAS、CUTLASS),具备GPU性能分析的能力者优先
了解AI Compiler技术栈(MLIR等),熟悉Torch2.0+编译栈、Triton优先者优先

AI 洞察

优缺点分析

优点

  • 前沿技术栈,涉及GPU、编译器、大模型优化,技术成长快
  • 字节跳动大平台,资源丰富,项目影响力大
  • 与顶尖团队合作,接触业界最新硬件和算法
  • 技术难度高,需要同时掌握软件和硬件知识,学习曲线陡峭
  • 互联网大厂工作强度较大,可能需要应对紧急优化任务
  • 领域竞争激烈,需持续跟进芯片和算法演进

缺点 / 挑战

  • 适合热爱底层系统优化、享受性能调优挑战、希望深耕AI基础设施的资深工程师

角色解读

  • 向系统架构师或技术负责人方向发展,主导大规模AI基础设施优化
  • 深入芯片设计或编译器研发,成为软硬件协同领域的专家
  • 可横向扩展至AI框架开发或数据中心性能优化等方向
  • 评估异构计算芯片性能,建立负载模型,预估业务收益
  • 针对推理和训练场景优化芯片适配,降低时延、提高吞吐
  • 开发高性能算子,优化算力和带宽利用率
  • 通过编译技术实现芯片在不同业务中的落地,调研前沿软硬件结合方向
  • 精通C/C++和Python,具备扎实的计算机科学功底
  • 熟练使用TensorFlow/PyTorch,熟悉框架内部实现
  • 熟悉GPU或其它并行计算架构及其编程模型
  • 了解AI编译器(如MLIR、TVM)和GPU软件栈(CUDA、CUTLASS)

申请策略

  • 在简历中量化优化成果,如降低延迟百分比、提升吞吐倍数
  • 关注字节跳动火山方舟的业务方向,在面试中展现对AI基础设施的理解
  • 突出异构计算优化项目经验,如GPU算子调优、推理加速、大规模训练优化
  • 强调对深度学习框架底层实现的理解,如自定义算子或编译栈改造
  • 展示编译器相关经验,如MLIR或TVM的实际应用案例
  • 深入学习GPU架构和CUDA编程,掌握性能分析工具
  • 补充AI编译器知识,实践MLIR或Triton
  • 了解最新大模型优化技术,如量化、剪枝、投机采样

面试指南

  • 结合具体项目,从问题定义、方案设计、实施步骤、效果量化四个层次回答
  • 展示对底层原理的理解,同时说明业务影响和权衡
  • 请详细描述一次你优化AI模型推理性能的经历,使用了哪些方法?
  • 解释CUDA中shared memory和global memory的区别,如何优化内存访问?
  • MLIR的工作流程是什么?它在AI编译中扮演什么角色?
  • 如何对一个Transformer模型进行训练加速?考虑哪些方面?
  • 你如何评估一款新的AI芯片是否适合我们的业务场景?
  • 复习CUDA编程模型和GPU架构,准备一个性能优化案例

匹配度报告

72
综合匹配度

字节跳动高级技术专家,前沿AI异构计算,高薪高成长,但工作强度大。

适合人群
最适合追求技术深度和前沿发展的求职者,对工作生活平衡要求不高。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利80
成长发展90
工作生活50
使命价值70

薪资福利匹配

80较高

字节跳动薪资具有竞争力,虽然JD未明确说明,但大厂高级岗位通常配套完善福利,补偿性动机满足度较高。

薪资信号未披露(AI估算:30K-60K/月)

成长发展匹配

90较高

该职位涉及前沿技术如GPU优化、AI编译器、大模型加速,技术成长空间极大,发展性动机满足度很高。

技术前沿前沿/新兴技术
技术栈CUDA、MLIR、TensorFlow、PyTorch、并行计算、稀疏计算、存内计算
业务类型ambiguous

工作生活匹配

50较低

工作地点杭州,仅现场办公,未提及弹性工作或远程,互联网大厂通常工作强度较大,生活化动机满足度一般。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值匹配

70中等

AI基础设施领域处于高速增长赛道,技术影响力大,但社会价值中性,意义感动机有一定满足度。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 品牌广告产品经理(品牌竞价方向)-中国商业产品与技术(北京/上海)

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 商品策略运营(作者方向)-抖音电商

    字节跳动 · 北京市
    AI 估算 · 20k-40k
  • 高级抖音用户产品经理-汽水音乐

    字节跳动 · 北京市
    AI 估算 · 25k-40k
  • iOS资深研发工程师-TikTok搜索

    字节跳动 · 上海市
    AI 估算 · 30k-50k
  • 平台治理前端开发工程师-生活服务

    字节跳动 · 上海市
    AI 估算 · 25k-45k

相似职位推荐

  • 快手后端实习生(后端/AI方向)

    快手 · 北京市
    AI 估算 · 4k-6k
  • 服务端测试开发工程师-【商业化】

    快手 · 北京市
    AI 估算 · 25k-45k
  • 服务端测试开发工程师-【线索营销】

    快手 · 北京市
    AI 估算 · 25k-45k
  • 后端开发-数智

    中国平安 · 深圳市
    AI 估算 · 25k-40k

字节跳动 的其他在招职位

  • 品牌广告产品经理(品牌竞价方向)-中国商业产品与技术(北京/上海)

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 商品策略运营(作者方向)-抖音电商

    字节跳动 · 北京市
    AI 估算 · 20k-40k
  • 高级抖音用户产品经理-汽水音乐

    字节跳动 · 北京市
    AI 估算 · 25k-40k
  • iOS资深研发工程师-TikTok搜索

    字节跳动 · 上海市
    AI 估算 · 30k-50k
  • 平台治理前端开发工程师-生活服务

    字节跳动 · 上海市
    AI 估算 · 25k-45k

相似职位推荐

  • 快手后端实习生(后端/AI方向)

    快手 · 北京市
    AI 估算 · 4k-6k
  • 服务端测试开发工程师-【商业化】

    快手 · 北京市
    AI 估算 · 25k-45k
  • 服务端测试开发工程师-【线索营销】

    快手 · 北京市
    AI 估算 · 25k-45k
  • 后端开发-数智

    中国平安 · 深圳市
    AI 估算 · 25k-40k