Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
硬件加速模型编译优化工程师-Data
立即应聘

硬件加速模型编译优化工程师-Data

发布于 大约 14 小时前

普通员工/个人贡献者

深圳市
中级经验
全职员工
仅现场办公
本科
GPU
PyTorch
TensorFlow
LLM
MLIR
ONNX
TVM
分布式推理

AI 估算 · 30k–50k

字节跳动高级技术岗,深圳薪资较高,自研芯片方向稀缺,竞争力强。

职位详情

关于这个职位

该职位主要负责大模型在自研芯片上的性能评估与软硬件协同优化,涉及算子编译框架优化、分布式推理系统构建及模型量化等工作

适合对AI加速硬件和编译器技术有深入理解、具备C/C++和Python开发经验的工程师

最低要求

深入理解AI加速硬件的体系结构和并行计算

熟悉深度学习框架和软件栈,熟练使用C/C++、Python等编程语言
熟悉ONNX/TensorFlow/PyTorch等主流深度学习框架
有主动学习、问题分析与解决能力和较强自驱力
具备良好的跨团队协作能力

工作职责

负责大模型等业务模型在自研芯片进行适配性和性能评估、软硬件协同优化工作

负责AI模型整图或者算子编译框架优化,实现较高硬件利用率和整体性能,提升编译框架的通用性与优化能力
构建分布式推理系统,推理框架极致调优,实现较优的在线部署吞吐和高性价比
模型量化、稀疏、蒸馏等推理部署的探索和落地方案

优先资格

熟悉编译器和代码优化技术,有MLIR、TVM等相关开发经验

熟悉GPU或者主流AI芯片架构,有相关算子优化、图编译优化经验、硬件评测经验
对LLM或多模态领域模型有深刻理解,例如Qwen、Deepseek等
有AI加速硬件的量化工具开发经验
熟悉AI服务器和集群架构,熟悉芯片和集群互联相关技术,有实践开发经验
有vLLM、SGLang等推理框架开发和调优经验,有部署实践相关经验

AI 洞察

优缺点分析

优点

  • 深度参与自研芯片的软硬件协同优化,技术含金量高,积累稀缺经验
  • 字节跳动大平台,数据规模大,业务场景丰富,项目影响力强
  • 团队技术氛围浓厚,接触前沿的LLM和多模态模型部署技术
  • 工作强度较大,涉及软硬件联合调试,问题定位复杂
  • 需要持续学习新模型和新硬件,技术迭代快
  • 自研芯片生态尚在发展中,兼容性和工具链可能不完善
  • 适合对底层软硬件优化充满热情、有强自驱力和问题解决能力的资深工程师

缺点 / 挑战

暂无明显挑战项

角色解读

  • 技术深耕:成为AI芯片编译器或推理优化领域专家
  • 架构方向:晋升为系统架构师,主导推理系统的整体设计
  • 横向扩展:转向AI芯片设计或全栈AI系统优化
  • 评估和优化大模型在自研AI芯片上的性能,进行软硬件协同设计
  • 开发和改进编译框架,包括算子编译和图编译,提升硬件利用率
  • 构建分布式推理系统,对推理框架进行极致调优,提高吞吐和性价比
  • 探索模型量化、稀疏化、蒸馏等部署优化技术并落地
  • 深入理解AI加速器体系结构(GPU/NPU等)和并行计算
  • 精通C/C++和Python,熟悉深度学习框架如PyTorch/TensorFlow
  • 熟悉编译器优化技术,有MLIR/TVM等编译框架经验优先
  • 了解大模型推理框架如vLLM、SGLang,以及分布式系统知识

申请策略

  • 准备一个你主导的性能优化案例,从问题分析到解决方案到效果量化
  • 了解字节跳动自研芯片(如火山引擎)的公开信息,展示兴趣
  • 突出编译器优化、AI芯片评测或算子开发的项目经验,用数据证明性能提升
  • 强调对TensorFlow/PyTorch框架的深入理解,以及分布式训练/推理经验
  • 如有MLIR/TVM/vLLM相关开源贡献,务必展示
  • 系统学习编译原理和LLVM/MLIR架构,动手编写简单的Pass
  • 熟悉主流AI芯片(如NVIDIA GPU、华为昇腾)的架构和编程模型

面试指南

  • 对于性能优化问题,采用“问题定位-瓶颈分析-方案设计-实验验证”的框架
  • 对于架构设计问题,从系统整体出发,权衡计算、内存、通信
  • 请解释TVM的Relay IR和AutoTVM的工作原理
  • 如何优化一个Transformer模型在特定芯片上的推理延迟?
  • 描述你如何调试一个内存带宽瓶颈的算子
  • LLM推理中KV cache优化有哪些常用方法?
  • 你对量化感知训练(QAT)和训练后量化(PTQ)有何经验?
  • 复习CUDA编程经验,熟悉GPU内存层级和并行模式

匹配度报告

69
综合匹配度

字节跳动自研芯片编译器优化岗,前沿技术栈、高强度、高成长。

适合人群
最适合追求技术成长和前沿挑战、愿意投入高强度工作的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利75
成长发展90
工作生活40
使命价值70

薪资福利匹配

75中等

字节跳动薪资在行业内具有竞争力,特别是高级技术岗位,但具体薪资未公开,且工作强度大可能影响性价比感知。

薪资信号未披露(AI估算:30K-50K/月)

成长发展匹配

90较高

该职位涉及前沿技术(自研芯片、编译器、LLM),成长空间大,且有明确的技术深度和广度发展路径。

技术前沿前沿/新兴技术
技术栈MLIR、TVM、GPU、LLM、分布式推理、量化
业务类型profit_center

工作生活匹配

40较低

字节跳动通常工作强度较大,JD中未提WLB,且深圳科技园通勤一般,生活平衡挑战大。

工作模式仅现场办公
办公地点科技园/产业园
加班情况JD含高强度暗示词

使命价值匹配

70中等

自研芯片对国产化有积极意义,但JD未明确社会价值导向,行业方向属于高速增长赛道。

行业发展高速增长赛道
社会影响中性/一般
创新程度开拓性创新(行业首创)
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 品牌广告产品经理(品牌竞价方向)-中国商业产品与技术(北京/上海)

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 商品策略运营(作者方向)-抖音电商

    字节跳动 · 北京市
    AI 估算 · 20k-40k
  • 高级抖音用户产品经理-汽水音乐

    字节跳动 · 北京市
    AI 估算 · 25k-40k
  • iOS资深研发工程师-TikTok搜索

    字节跳动 · 上海市
    AI 估算 · 30k-50k
  • 平台治理前端开发工程师-生活服务

    字节跳动 · 上海市
    AI 估算 · 25k-45k

相似职位推荐

  • 快手后端实习生(后端/AI方向)

    快手 · 北京市
    AI 估算 · 4k-6k
  • 服务端测试开发工程师-【商业化】

    快手 · 北京市
    AI 估算 · 25k-45k
  • 服务端测试开发工程师-【线索营销】

    快手 · 北京市
    AI 估算 · 25k-45k
  • 后端开发-数智

    中国平安 · 深圳市
    AI 估算 · 25k-40k

字节跳动 的其他在招职位

  • 品牌广告产品经理(品牌竞价方向)-中国商业产品与技术(北京/上海)

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 商品策略运营(作者方向)-抖音电商

    字节跳动 · 北京市
    AI 估算 · 20k-40k
  • 高级抖音用户产品经理-汽水音乐

    字节跳动 · 北京市
    AI 估算 · 25k-40k
  • iOS资深研发工程师-TikTok搜索

    字节跳动 · 上海市
    AI 估算 · 30k-50k
  • 平台治理前端开发工程师-生活服务

    字节跳动 · 上海市
    AI 估算 · 25k-45k

相似职位推荐

  • 快手后端实习生(后端/AI方向)

    快手 · 北京市
    AI 估算 · 4k-6k
  • 服务端测试开发工程师-【商业化】

    快手 · 北京市
    AI 估算 · 25k-45k
  • 服务端测试开发工程师-【线索营销】

    快手 · 北京市
    AI 估算 · 25k-45k
  • 后端开发-数智

    中国平安 · 深圳市
    AI 估算 · 25k-40k