Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
硬件加速推理引擎运行时开发工程师-AI工具链
立即应聘

硬件加速推理引擎运行时开发工程师-AI工具链

发布于 大约 2 小时前

普通员工/个人贡献者

北京市
高级经验
全职员工
仅现场办公
学历未注明
硬件工程
GPU
深度学习
CUDA
ROCm
NPU
异构计算
Ai推理引擎
芯片驱动

AI 估算 · 25k–50k

字节跳动大厂核心AI芯片岗位,技术栈稀缺,薪资竞争力强,月薪25-50K,15薪。

职位详情

关于这个职位

该职位负责字节跳动AI推理引擎的核心运行时开发,包括模型加载、图优化和算子调度等

需要精通C++和计算机体系结构,面向深度学习AI芯片进行Runtime/UMD软件栈的设计与维护
适合对底层系统有热情、熟悉GPU编程的开发者,前景广阔

最低要求

计算机科学/电子工程等相关专业,精通C++编程语言

计算机专业基础扎实,熟悉计算机体系结构、常用数据结构与算法
具有异构Runtime、驱动开发经验者优先
熟悉CUDA Runtime,AMD ROCm/CLR等软件,对CUDA兼容Runtime/UMD有过开发经验者优先
对新技术充满热情,能够快速在新的领域进行开拓并输出结
团队沟通协作能力强

工作职责

设计并实现推理引擎的核心运行时组件,包括模型加载、图优化、算子调度、内存管理等

面向深度学习AI芯片的Runtime/UMD软件栈的设计、开发与日常维护

优先资格

加分项

熟悉GPU体系结构NPU和常见异构编程模型
了解IC实现细节
有AI相关基础知识
熟悉Python语言

AI 洞察

优缺点分析

优点

  • 字节跳动大厂平台,资源丰富,技术与业务影响大
  • 涉及AI芯片前沿领域,技术栈稀缺,职业竞争力强
  • 薪资待遇优厚,且核心岗有股票/期权激励
  • 技术难度高,需要深入理解计算机体系结构和GPU底层
  • 行业技术迭代快,需持续学习新芯片和框架

缺点 / 挑战

  • 工作节奏快,可能面临较强加班压力
  • 适合对底层系统有强烈兴趣、热爱技术挑战、熟悉GPU编程的工程师,追求技术深度和职业发展

角色解读

  • 可向AI系统架构师方向成长,主导推理引擎整体架构设计
  • 也可深耕芯片软件栈,成为GPU/NPU底层系统专家
  • 未来可转型为AI芯片设计或软硬件协同优化专家,参与下一代芯片定义
  • 设计并实现深度学习推理引擎的核心运行时组件,包括模型加载、图优化、算子调度和内存管理等
  • 负责面向AI芯片的Runtime/UMD软件栈的开发与维护,确保高性能和稳定性
  • 优化推理引擎在GPU/NPU上的执行效率,解决性能瓶颈
  • 精通C++编程,具备扎实的计算机体系结构和数据结构基础
  • 熟悉CUDA Runtime、ROCm等GPU编程模型,有异构计算开发经验
  • 对AI推理引擎或芯片驱动有深入理解,能够独立完成运行时组件设计
  • 具备良好的团队协作和沟通能力,能快速学习新技术

申请策略

  • 了解字节AI工具链产品方向,在面试中展现对AI芯片生态的理解
  • 准备一个底层优化项目案例,体现问题分析和解决能力
  • 突出C++项目经验,尤其是性能优化或底层系统开发相关
  • 强调CUDA、ROCm等GPU编程经验,展示动手能力
  • 如有Runtime或驱动开发经历,重点描述技术细节和成果
  • 附加开源贡献或技术博客,体现对新技术热情
  • 系统学习CUDA编程和GPU体系结构,可阅读NVIDIA官方文档
  • 实践AI推理框架(如TensorRT、ONNX Runtime)源码理解

面试指南

  • 对于技术问题,先明确核心概念,再结合项目经验阐述设计思路
  • 性能优化类问题,采用“问题-分析-方案-效果”的结构回答
  • 开放性设计问题,先定义需求边界,再分层讨论架构和权衡
  • 请解释CUDA中的grid、block、thread分层结构及如何影响性能
  • 如何设计一个高效的推理引擎算子调度器?
  • 在GPU上实现内存管理时,有哪些关键考虑因素?
  • 描述一次你优化系统性能的经历,使用了哪些方法?
  • 谈谈你对AI芯片Runtime软件栈的理解

匹配度报告

74
综合匹配度

大厂AI芯片核心岗,前沿技术栈,高薪高压,成长空间大。

适合人群
首选追求技术成长和薪资回报的求职者,能接受较高工作强度。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展90
工作生活50
使命价值70

薪资福利匹配

85较高

字节跳动大厂核心岗位,薪资水平在行业内处于领先地位,且通常包含高额年终奖及期权,充分满足补偿性动机。

薪资信号未披露(AI估算:25K-50K/月)

成长发展匹配

90较高

该职位涉及AI芯片前沿技术栈(GPU/NPU、CUDA/ROCm),技术难度高,能快速提升底层系统能力,发展空间广阔。

技术前沿前沿/新兴技术
技术栈C++、CUDA、ROCm、GPU、NPU、Runtime
业务类型ambiguous

工作生活匹配

50较低

北京大厂核心研发岗位,工作强度较大,未提及弹性办公或远程,生活化动机满足度一般。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值匹配

70中等

AI芯片是驱动人工智能发展的关键基础设施,具有一定社会价值,但岗位主要聚焦于工程实现,使命感相对有限。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 短剧品牌招商运营-CQC

    字节跳动 · 成都市
    AI 估算 · 8k-15k
  • 商业化战略BP

    字节跳动 · 上海市
    AI 估算 · 20k-35k
  • 推荐算法工程师-分发与互动

    字节跳动 · 上海市
    AI 估算 · 25k-50k
  • 推荐策略产品经理(抖省省)-抖音生活服务

    字节跳动 · 北京市
    AI 估算 · 25k-40k
  • AI智能客服产品专家-抖音生活服务

    字节跳动 · 上海市
    AI 估算 · 25k-45k

相似职位推荐

  • 电池电源硬件研发工程师

    美团 · 深圳市
    AI 估算 · 20k-40k
  • System Application Engineer

    英伟达 · 北京市
    AI 估算 · 25k-45k
  • Mechanical Solution Engineer, Robotics

    英伟达 · 上海市
    AI 估算 · 30k-50k
  • Senior Power and Performance Engineer

    英伟达 · 上海市
    AI 估算 · 50k-80k
  • Product Engineer

    恩智浦半导体 · 天津市
    AI 估算 · 18k-25k

字节跳动 的其他在招职位

  • 短剧品牌招商运营-CQC

    字节跳动 · 成都市
    AI 估算 · 8k-15k
  • 商业化战略BP

    字节跳动 · 上海市
    AI 估算 · 20k-35k
  • 推荐算法工程师-分发与互动

    字节跳动 · 上海市
    AI 估算 · 25k-50k
  • 推荐策略产品经理(抖省省)-抖音生活服务

    字节跳动 · 北京市
    AI 估算 · 25k-40k
  • AI智能客服产品专家-抖音生活服务

    字节跳动 · 上海市
    AI 估算 · 25k-45k

相似职位推荐

  • 电池电源硬件研发工程师

    美团 · 深圳市
    AI 估算 · 20k-40k
  • System Application Engineer

    英伟达 · 北京市
    AI 估算 · 25k-45k
  • Mechanical Solution Engineer, Robotics

    英伟达 · 上海市
    AI 估算 · 30k-50k
  • Senior Power and Performance Engineer

    英伟达 · 上海市
    AI 估算 · 50k-80k
  • Product Engineer

    恩智浦半导体 · 天津市
    AI 估算 · 18k-25k