Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
硬件加速模型编译优化工程师-Data
立即应聘

硬件加速模型编译优化工程师-Data

发布于 大约 14 小时前

普通员工/个人贡献者

上海市
高级经验
全职员工
仅现场办公
学历未注明
PyTorch
TensorFlow
LLM
GPU架构
AI芯片
MLIR
ONNX
TVM
SGLang
vLLM

AI 估算 · 30k–60k

大厂核心岗位,AI芯片编译优化方向稀缺性强,但经验要求高,薪资处于行业较高水平。

职位详情

关于这个职位

该职位负责大模型在自研芯片上的适配、性能评估与软硬件协同优化,包括编译框架优化、分布式推理系统构建以及模型量化、稀疏化等部署工作

你将与团队一起推动AI推理的高效落地,涉及底层硬件与顶层算法的深度结合
适合对AI芯片、编译优化和推理系统有浓厚兴趣的技术专家

最低要求

深入理解AI加速硬件的体系结构和并行计算

熟悉深度学习框架和软件栈,熟练使用C/C++、Python等编程语言
熟悉ONNX/TensorFlow/PyTorch等主流深度学习框架
有主动学习、问题分析与解决能力和较强自驱力
具备良好的跨团队协作能力

工作职责

负责大模型等业务模型在自研芯片进行适配性和性能评估、软硬件协同优化工作

负责AI模型整图或者算子编译框架优化,实现较高硬件利用率和整体性能,提升编译框架的通用性与优化能力
构建分布式推理系统,推理框架极致调优,实现较优的在线部署吞吐和高性价比
模型量化、稀疏、蒸馏等推理部署的探索和落地方案

优先资格

熟悉编译器和代码优化技术,有MLIR、TVM等相关开发经验

熟悉GPU或者主流AI芯片架构,有相关算子优化、图编译优化经验、硬件评测经验
对LLM或多模态领域模型有深刻理解,例如Qwen、Deepseek等
有AI加速硬件的量化工具开发经验
熟悉AI服务器和集群架构,熟悉芯片和集群互联相关技术,有实践开发经验
有vLLM、SGLang等推理框架开发和调优经验,有部署实践相关经验

AI 洞察

优缺点分析

优点

  • 涉及AI芯片核心领域,技术前沿且稀缺,个人竞争力提升快
  • 字节跳动平台资源丰富,数据量大,能接触到业界最大规模的模型部署场景
  • 团队技术氛围浓厚,可参与自研芯片的全流程优化,成就感强
  • 技术栈深且复杂,需要同时掌握硬件、编译、算法等多领域知识,学习曲线陡峭
  • 自研芯片生态相对封闭,技术通用性受限,未来跳槽可能需要适应其他平台
  • 适合对AI芯片底层技术充满热情、有扎实编译和并行计算背景、愿意在字节跳动高强度环境下深耕硬核技术的工程师

缺点 / 挑战

  • 业务压力大,模型迭代快,需要快速适配优化,工作强度较高

角色解读

  • 从模型编译优化专家成长为AI芯片全栈架构师,主导芯片-算法协同设计
  • 向AI基础设施方向拓展,负责大规模推理集群的架构与优化
  • 在字节跳动内部,有机会深耕AI前沿技术,参与下一代自研芯片的研发
  • 评估大模型在自研芯片上的性能,进行软硬件协同优化
  • 开发AI模型的编译框架,优化算子和图编译,提升硬件利用率和性能
  • 构建分布式推理系统,进行推理框架调优,实现高吞吐和低成本部署
  • 探索模型量化、稀疏化、蒸馏等部署技术,推动落地应用
  • 深入理解AI加速硬件架构和并行计算,如GPU、NPU等
  • 精通C/C++和Python,熟悉主流深度学习框架如PyTorch、TensorFlow
  • 掌握编译优化技术,有MLIR、TVM等开发经验者优先
  • 具备分布式推理系统调优经验,熟悉vLLM、SGLang等推理框架

申请策略

  • 提前了解字节跳动自研芯片(如火山引擎相关)的技术方向,在面试中展现兴趣
  • 准备一个完整的模型优化案例,从性能分析到编译优化到部署收益
  • 突出编译器开发或AI芯片优化项目经历,如MLIR/TVM使用、算子kernel调优等
  • 展示分布式推理或模型部署实战经验,如vLLM/SGLang调优、量化工具开发
  • 强调对LLM等大模型的深入理解,包括模型结构、推理特性等
  • 如果有芯片相关论文或专利,务必列出
  • 补充学习MLIR、TVM等编译框架的源码和原理
  • 动手实践对LLM的量化、推理加速,熟悉常用工具链

面试指南

  • 对于编译优化问题,先明确目标(性能、功耗等),再分析硬件瓶颈(计算、访存),最后结合算子融合、内存布局、并行策略等给出方案
  • 对于推理系统问题,从模型特性(计算密集、访存密集)出发,考虑数据并行、张量并行、流水线并行等策略,并注意通信开销
  • 对于模型量化问题,介绍量化原理(对称/非对称、逐层/逐通道),比较不同精度(INT8/FP8)的优劣,并提及校准数据集和蒸馏技巧
  • 请解释TVM中的调度(schedule)和自动调优(auto-tuning)原理
  • 如何优化一个Transformer模型的推理性能?请从软硬件协同角度说明
  • MLIR的多级方言(dialect)是如何帮助编译优化的?举例说明
  • 在分布式推理中,如何平衡吞吐和延迟?你有哪些调优经验?
  • 你对LLM的量化方法(如GPTQ、AWQ)了解多少?如何部署量化模型?

匹配度报告

66
综合匹配度

字节跳动核心岗位,前沿AI芯片编译优化,高成长性但强度大。

适合人群
该职位最适合追求技术成长和前沿挑战的求职者,不太适合看重工作生活平衡的人。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利75
成长发展90
工作生活40
使命价值60

薪资福利匹配

75中等

字节跳动薪资在业界具有竞争力,但具体金额未披露;福利包括五险一金等常规项,但JD未详细列出。

薪资信号未披露(AI估算:30K-60K/月)

成长发展匹配

90较高

该职位涉及最前沿的AI芯片编译优化和推理部署技术,成长空间极大,但JD未明确提及晋升通道。

技术前沿前沿/新兴技术
技术栈C/C++、Python、ONNX、TensorFlow、PyTorch、MLIR、TVM、GPU、AI芯片、LLM、vLLM、SGLang、分布式推理、量化、稀疏化
业务类型profit_center

工作生活匹配

40较低

字节跳动通常要求现场办公,工作强度较高,JD未提及WLB或远程相关福利。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

60中等

AI芯片和编译优化属于技术前沿,对行业有推动意义,但JD未提及具体社会价值导向。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 品牌广告产品经理(品牌竞价方向)-中国商业产品与技术(北京/上海)

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 商品策略运营(作者方向)-抖音电商

    字节跳动 · 北京市
    AI 估算 · 20k-40k
  • 高级抖音用户产品经理-汽水音乐

    字节跳动 · 北京市
    AI 估算 · 25k-40k
  • iOS资深研发工程师-TikTok搜索

    字节跳动 · 上海市
    AI 估算 · 30k-50k
  • 平台治理前端开发工程师-生活服务

    字节跳动 · 上海市
    AI 估算 · 25k-45k

相似职位推荐

  • AI Agent算法专家(智能创作方向)

    快手 · 北京市
    AI 估算 · 35k-55k
  • Function & Baseline Management

    大众汽车 · 合肥市
    AI 估算 · 20k-30k
  • 【26年度台湾地区青年实习】机械制造设计(东航资产)

    中国东方航空 · 上海市
    AI 估算 · 4k-6k
  • 大模型应用评测算法工程师

    美团 · 北京市
    AI 估算 · 25k-45k

字节跳动 的其他在招职位

  • 品牌广告产品经理(品牌竞价方向)-中国商业产品与技术(北京/上海)

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 商品策略运营(作者方向)-抖音电商

    字节跳动 · 北京市
    AI 估算 · 20k-40k
  • 高级抖音用户产品经理-汽水音乐

    字节跳动 · 北京市
    AI 估算 · 25k-40k
  • iOS资深研发工程师-TikTok搜索

    字节跳动 · 上海市
    AI 估算 · 30k-50k
  • 平台治理前端开发工程师-生活服务

    字节跳动 · 上海市
    AI 估算 · 25k-45k

相似职位推荐

  • AI Agent算法专家(智能创作方向)

    快手 · 北京市
    AI 估算 · 35k-55k
  • Function & Baseline Management

    大众汽车 · 合肥市
    AI 估算 · 20k-30k
  • 【26年度台湾地区青年实习】机械制造设计(东航资产)

    中国东方航空 · 上海市
    AI 估算 · 4k-6k
  • 大模型应用评测算法工程师

    美团 · 北京市
    AI 估算 · 25k-45k