Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
硬件加速模型编译优化工程师-Data
立即应聘

硬件加速模型编译优化工程师-Data

发布于 大约 14 小时前

普通员工/个人贡献者

北京市
高级经验
全职员工
仅现场办公
学历未注明
GPU
PyTorch
TensorFlow
量化
MLIR
ONNX
大模型
TVM
SGLang
vLLM

AI 估算 · 30k–60k

高端技术岗,底层系统优化,薪资竞争力强,字节跳动大厂待遇优厚。

职位详情

关于这个职位

该职位负责大模型在自研芯片上的适配与性能优化,涉及编译框架、分布式推理系统及模型量化、蒸馏等部署技术

需要深入理解AI芯片架构和深度学习框架,具备C/C++和Python编程能力,适合对硬件加速和系统优化有浓厚兴趣的工程师

最低要求

深入理解AI加速硬件的体系结构和并行计算

熟悉深度学习框架和软件栈,熟练使用C/C++、Python等编程语言
熟悉ONNX/TensorFlow/PyTorch等主流深度学习框架
有主动学习、问题分析与解决能力和较强自驱力
具备良好的跨团队协作能力

工作职责

负责大模型等业务模型在自研芯片进行适配性和性能评估、软硬件协同优化工作

负责AI模型整图或者算子编译框架优化,实现较高硬件利用率和整体性能,提升编译框架的通用性与优化能力
构建分布式推理系统,推理框架极致调优,实现较优的在线部署吞吐和高性价比
模型量化、稀疏、蒸馏等推理部署的探索和落地方案

优先资格

熟悉编译器和代码优化技术,有MLIR、TVM等相关开发经验

熟悉GPU或者主流AI芯片架构,有相关算子优化、图编译优化经验、硬件评测经验
对LLM或多模态领域模型有深刻理解,例如Qwen、DeepSeek等
有AI加速硬件的量化工具开发经验
熟悉AI服务器和集群架构,熟悉芯片和集群互联相关技术,有实践开发经验
有vLLM/SGLang等推理框架开发和调优经验,有部署实践相关经验

AI 洞察

优缺点分析

优点

  • 站在AI硬件与软件交叉前沿,接触自研芯片,技术积累深厚
  • 字节跳动大平台,资源丰富,项目影响力大
  • 团队技术氛围浓厚,可接触到业界最新的大模型和推理技术
  • 薪资待遇优厚,职业发展空间广阔
  • 技术难度高,需要同时掌握硬件架构、编译优化和深度学习,学习曲线陡峭
  • 工作强度可能较大,涉及多个技术栈和跨团队协作
  • 自研芯片生态尚在完善,可能遇到较多底层问题需要攻坚

缺点 / 挑战

  • 适合对AI硬件加速有强烈兴趣,具备扎实的系统编程和编译优化基础,喜欢挑战底层技术难题的工程师

角色解读

  • 可向AI芯片编译器架构师方向发展,主导编译器设计与优化
  • 可转为AI系统性能优化专家,深入底层系统调优
  • 有机会参与自研芯片的完整软硬件栈设计,成为全栈芯片工程师
  • 负责大模型在自研芯片上的适配评估与软硬件协同优化,确保模型高效运行
  • 优化AI模型编译框架,提升硬件利用率和整体性能,增强编译框架通用性
  • 构建并调优分布式推理系统,提高在线部署吞吐量和性价比
  • 探索并落地模型量化、稀疏化、蒸馏等推理部署技术
  • 深入理解AI芯片体系结构和并行计算原理
  • 精通C/C++和Python,熟悉深度学习框架如PyTorch、TensorFlow
  • 具备编译优化经验,了解MLIR、TVM等技术
  • 有分布式系统和模型部署实践经验

申请策略

  • 关注字节跳动Data部门的技术博客,了解其自研芯片和推理框架动态
  • 在面试中展示对性能优化的热情和具体项目成果,最好有数据对比
  • 突出芯片或GPU相关性能优化项目,尤其是算子优化、图编译优化经验
  • 强调深度学习框架的底层使用经验,如自定义算子、模型量化等
  • 展示C/C++和Python的编程能力,如有开源贡献更佳
  • 提及对LLM或多模态模型的理解,例如参与过相关部署项目
  • 补充MLIR/TVM等编译框架知识,动手实践一个小型算子优化案例
  • 熟悉vLLM/SGLang等推理框架,了解其架构和调优方法

面试指南

  • 对于性能优化问题,采用「问题分析-瓶颈定位-优化方案-效果验证」的结构,先分析计算和访存模式,再选择合适优化手段(如算子融合、内存布局调整)
  • 对于编译技术问题,先阐述基本原理,再结合具体框架(如MLIR)说明实际应用场景,最后提一下未来趋势
  • 对于部署经验问题,从模型压缩、推理框架选择、服务化架构等角度展开,强调端到端考虑
  • 请描述你如何优化一个深度学习算子使其在特定硬件上达到更高性能?
  • 解释MLIR的Dialect机制以及如何在AI编译中使用
  • 如何对大模型进行量化?量化对精度和性能的影响如何权衡?
  • 讲一下分布式推理中常见的瓶颈和优化策略
  • 你对自研芯片的软硬件协同设计有什么理解或经验?

匹配度报告

71
综合匹配度

字节跳动Data团队高薪技术岗,前沿AI芯片编译优化,成长空间大但工作强度高。

适合人群
最合适追求前沿技术成长和高薪回报的求职者,对工作生活平衡要求不高。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展90
工作生活40
使命价值70

薪资福利匹配

85较高

字节跳动大厂,薪资在行业内处于较高水平,福利完善,但JD未明确薪资和具体福利,按市场水准估计。

薪资信号偏高 (30K-60K/月)

成长发展匹配

90较高

岗位涉及AI芯片和编译优化等前沿技术,成长空间大,JD中提及多项高级技术,发展性突出。

技术前沿前沿/新兴技术
技术栈大模型、自研芯片、MLIR、TVM、量化、分布式推理、GPU、vLLM、SGLang
业务类型profit_center

工作生活匹配

40较低

仅现场办公,未提及弹性工作或WLB,字节跳动通常工作强度较大,生活化程度较低。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

70中等

AI芯片和加速技术属于高增长赛道,对社会有较大潜在影响,但JD未强调社会价值,意义感中等。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 物流供应商管理专家-TikTok Shop

    字节跳动 · 珠海市
    AI 估算 · 25k-40k
  • 产品经理(广告信号方向)-国际商业化产品与技术(北京/上海)

    字节跳动 · 北京市
    AI 估算 · 25k-40k
  • 消息队列产品经理-Data

    字节跳动 · 杭州市
    AI 估算 · 30k-50k
  • 商家产品运营高级经理-抖音生活服务

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • CRM产品经理(AI方向)-抖音电商

    字节跳动 · 上海市
    AI 估算 · 30k-55k

字节跳动 的其他在招职位

  • 物流供应商管理专家-TikTok Shop

    字节跳动 · 珠海市
    AI 估算 · 25k-40k
  • 产品经理(广告信号方向)-国际商业化产品与技术(北京/上海)

    字节跳动 · 北京市
    AI 估算 · 25k-40k
  • 消息队列产品经理-Data

    字节跳动 · 杭州市
    AI 估算 · 30k-50k
  • 商家产品运营高级经理-抖音生活服务

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • CRM产品经理(AI方向)-抖音电商

    字节跳动 · 上海市
    AI 估算 · 30k-55k