Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
硬件加速推理引擎运行时开发工程师-AI工具链
立即应聘

硬件加速推理引擎运行时开发工程师-AI工具链

发布于 大约 15 小时前

普通员工/个人贡献者

上海市
中级经验
全职员工
仅现场办公
本科
软件工程
GPU
内存管理
CUDA
ROCm
AI芯片
NPU
图优化
异构编程
深度学习推理引擎

AI 估算 · 25k–45k

大厂AI芯片核心岗位,技术壁垒高,薪资具备市场竞争力,且字节通常提供15-16薪。

职位详情

关于这个职位

加入字节跳动AI工具链团队,你将负责设计并实现高性能深度学习推理引擎的运行时核心组件,包括模型加载、图优化、算子调度和内存管理等

面向自研AI芯片进行Runtime/UMD软件栈的开发与维护,需要扎实的C++功底和计算机体系结构知识,适合对AI芯片底层优化充满热情的技术人才

最低要求

计算机科学/电子工程等相关专业,精通C++编程语言

计算机专业基础扎实,熟悉计算机体系结构、常用数据结构与算法
具有异构Runtime、驱动开发经验者优先
熟悉CUDA Runtime,AMD ROCm/CLR等软件,对CUDA兼容Runtime/UMD有过开发经验者优先
对新技术充满热情,能够快速在新的领域进行开拓并输出结
团队沟通协作能力强

工作职责

设计并实现推理引擎的核心运行时组件,包括模型加载、图优化、算子调度、内存管理等

面向深度学习AI芯片的Runtime/UMD软件栈的设计、开发与日常维护

优先资格

熟悉GPU体系结构NPU和常见异构编程模型

了解IC实现细节
有AI相关基础知识
熟悉Python语言

AI 洞察

优缺点分析

优点

  • 字节跳动头部大厂,AI芯片自研方向前景广阔,技术积累深厚
  • 团队氛围技术导向,有机会参与前沿推理引擎设计
  • 技术门槛高,需要同时掌握体系结构、Runtime、AI框架等多领域知识

缺点 / 挑战

  • 接触自研AI芯片最底层软件栈,技术挑战大,成长快
  • 工作强度较大,互联网大厂节奏快,需适应项目迭代压力
  • 适合对AI芯片底层软件充满热情、乐于挑战高难度技术问题的C++/系统软件工程师

角色解读

  • 深耕AI芯片底层软件栈,成为Runtime/系统软件专家
  • 向AI工具链架构师或技术Leader方向发展,主导推理引擎整体设计
  • 设计并实现推理引擎的运行时组件,如图优化、算子调度和内存管理,确保模型高效运行
  • 负责AI芯片Runtime/UMD软件栈的开发与维护,打通深度学习框架与底层硬件
  • 精通C++,熟悉计算机体系结构、数据结构和算法
  • 了解GPU编程模型(CUDA/ROCm)及异构Runtime开发经验

申请策略

  • 关注字节跳动AI Infra团队的技术博客,了解其技术栈和方向
  • 准备一个自研Runtime或推理优化相关的项目案例,展示系统设计能力
  • 突出C++项目经验,特别是高性能计算或系统软件相关
  • 强调GPU编程(CUDA/ROCm)或异构Runtime开发经历
  • 展示对计算机体系结构的理解,如内存管理、缓存优化等
  • 补充学习AI推理框架(如TensorRT、TVM)的运行时设计
  • 熟悉GPU体系结构(如SM、warp调度)及常见AI芯片架构

面试指南

  • 结构化回答:先明确问题核心,再分点阐述设计思路或原理,最后结合项目经验
  • 技术深度:不仅要讲实现,还要分析权衡(如性能 vs 内存)
  • 请设计一个简单的推理引擎运行时内存管理方案
  • CUDA里Stream和Event是如何工作的?如何实现算子调度?
  • 描述一次你优化C++程序性能的经历
  • 解释图优化中常量折叠和算子融合的原理
  • 复习计算机体系结构(缓存、SIMD、流水线)和C++高级特性
  • 准备一个GPU/Runtime相关项目的深度讲解,包括难点和优化点

匹配度报告

71
综合匹配度

字节跳动AI芯片核心岗,前沿技术栈,薪资高但WLB一般。

适合人群
适合追求技术成长和高薪回报,对工作强度有准备的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展90
工作生活40
使命价值70

薪资福利匹配

85较高

字节跳动薪酬具有市场竞争力,但JD未明确薪资;作为大厂核心岗位,薪资福利属行业领先水平。

薪资信号未披露(AI估算:25K-45K/月)

成长发展匹配

90较高

该职位涉及自研AI芯片Runtime开发,技术栈前沿(C++/CUDA/异构计算),成长空间大,但JD未明确培训或晋升机制。

技术前沿前沿/新兴技术
技术栈C++、CUDA、ROCm、Runtime、AI芯片、异构编程
业务类型profit_center

工作生活匹配

40较低

上海现场办公,没有远程选项,互联网大厂通常工作强度较大,JD未提及WLB。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

70中等

AI芯片是高速增长赛道,技术影响力大,但社会效益层面中性。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 后端研发工程师-电商交易

    字节跳动 · 杭州市
    AI 估算 · 25k-45k
  • 原型验证工程师-Data(深圳)

    字节跳动 · 深圳市
    AI 估算 · 30k-60k
  • 后台开发工程师-抖音用户体验

    字节跳动 · 北京市
    AI 估算 · 30k-55k
  • 分类值班号-CQC

    字节跳动 · 重庆市
    AI 估算 · 6k-12k
  • 国际化商业策略产品经理-端变现

    字节跳动 · 北京市
    AI 估算 · 30k-60k

相似职位推荐

  • PE工程师(偏客户端方向)-社区互动

    小红书 · 北京市
    AI 估算 · 35k-60k
  • GPU调度研发工程师/专家

    小红书 · 上海市
    AI 估算 · 40k-70k
  • 数据仓库工程师-rednote

    小红书 · 深圳市
    AI 估算 · 15k-25k
  • 高级/资深Java开发工程师(推荐排序算法方向)(MJ035389)

    携程 · 上海市
    AI 估算 · 28k-45k
  • Sr. Assoc, BackEnd Eng, WRB Tech

    渣打银行 · 天津市
    AI 估算 · 25k-40k

字节跳动 的其他在招职位

  • 后端研发工程师-电商交易

    字节跳动 · 杭州市
    AI 估算 · 25k-45k
  • 原型验证工程师-Data(深圳)

    字节跳动 · 深圳市
    AI 估算 · 30k-60k
  • 后台开发工程师-抖音用户体验

    字节跳动 · 北京市
    AI 估算 · 30k-55k
  • 分类值班号-CQC

    字节跳动 · 重庆市
    AI 估算 · 6k-12k
  • 国际化商业策略产品经理-端变现

    字节跳动 · 北京市
    AI 估算 · 30k-60k

相似职位推荐

  • PE工程师(偏客户端方向)-社区互动

    小红书 · 北京市
    AI 估算 · 35k-60k
  • GPU调度研发工程师/专家

    小红书 · 上海市
    AI 估算 · 40k-70k
  • 数据仓库工程师-rednote

    小红书 · 深圳市
    AI 估算 · 15k-25k
  • 高级/资深Java开发工程师(推荐排序算法方向)(MJ035389)

    携程 · 上海市
    AI 估算 · 28k-45k
  • Sr. Assoc, BackEnd Eng, WRB Tech

    渣打银行 · 天津市
    AI 估算 · 25k-40k