Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
AI芯片系统软件架构师/工程师-NPU
立即应聘

AI芯片系统软件架构师/工程师-NPU

发布于 大约 2 小时前

普通员工/个人贡献者

深圳市
高级经验
全职员工
仅现场办公
本科
性能优化
CUDA
ROCm
驱动开发
AI芯片
NPU
GPGPU
Firmware

AI 估算 · 30k–50k

深圳互联网大厂AI芯片岗位,技术门槛高,市场稀缺,薪资处于行业领先水平。

职位详情

关于这个职位

该职位专注于自研AI加速芯片(NPU)的系统软件栈开发,包括驱动、固件和运行时环境

你将负责软硬件协同设计、性能分析优化以及第三方NPU IP的集成适配,涉及底层系统编程和深度学习架构的深入理解
这是一个技术挑战大、与行业前沿紧密结合的研发岗位

最低要求

本科及以上学历,计算机、体系结构等相关专业

熟悉Linux C/C++开发,有扎实的编程基础
有GPGPU/NPU芯片项目研发经验,熟悉Nvidia/AMD或国产厂家GPU计算产品,熟悉CUDA/ROCm等GPU软件栈
熟悉计算机体系架构,对深度学习有深入的理解,对GPGPU/NPU/CIM存算体系结构至少熟悉一种,理解其微架构、主要指令集等
有GPGPU/NPU Firmware/Linux驱动开发经验,对内存管理、Kernel任务调度、RAS等有实际开发调试经验
熟悉第三方NPU IP的软件栈移植集成,结合SoC架构进行性能分析优化

工作职责

跟踪GPGPU/NPU行业最新动态、产品与技术架构,分析公司内部业务系统需求,结合自研芯片架构,输出系统软硬件协同设计方案

负责自研AI加速芯片系统软件栈的开发交付,包括芯片设备侧Firmware/Host侧驱动/系统管理诊断工具
负责自研AI加速芯片的NPU/CIM存算方向的软硬协同验证,性能分析优化,基于可编程接口进行算子用例开发
负责NPU IP的软件栈移植适配与集成,包括NPU IP的Firmware/驱动/Runtime/SDK

优先资格

加分项:

有AI相关研发经验,熟悉CUDA编程,熟悉AI框架,对一种或者多种网络模型结构有深入理解
擅长跨团队沟通交流协作,有项目或团队管理经验

AI 洞察

优缺点分析

优点

  • 字节大平台,参与前沿AI芯片研发,技术影响力大
  • 涉及底层系统软件和硬件协同,技术壁垒高,职业竞争力强
  • 团队技术氛围浓厚,有机会接触业界顶尖的NPU/GPGPU技术
  • 技术复杂度高,需同时掌握软件和硬件知识,学习曲线陡峭
  • 行业竞争激烈,需持续跟进最新架构和工具链更新
  • 适合热爱底层系统编程、对芯片架构有浓厚兴趣,并愿意在高压环境下攻克技术难题的工程师

缺点 / 挑战

  • 芯片研发周期长,可能需要应对紧迫的项目交付压力

角色解读

  • 从技术专家角度,可深入芯片架构设计,成为芯片系统架构师
  • 横向扩展至AI算法或全栈开发,参与更广泛的产品落地
  • 在管理层面上,可带领团队负责芯片软件栈的规划与交付
  • 跟踪GPGPU/NPU行业趋势,结合业务需求设计系统软硬件协同方案
  • 开发自研AI加速芯片的完整软件栈,包括固件、驱动、运行时和诊断工具
  • 进行NPU/CIM方向的软硬件协同验证与性能优化,开发算子用例
  • 移植并集成第三方NPU IP的软件栈,确保与SoC架构的高效配合
  • 精通Linux下的C/C++编程,具备扎实的系统编程能力
  • 深入理解GPGPU/NPU体系架构,熟悉CUDA或ROCm等GPU软件栈
  • 拥有Firmware或Linux驱动开发经验,了解内存管理、任务调度和RAS机制
  • 熟悉深度学习框架和常见网络模型,具备性能分析和调优能力

申请策略

  • 在面试前了解字节自研芯片(如火山引擎)的业务方向,准备相关技术见解
  • 关注行业动态,如NVIDIA Hopper架构或AMD CDNA,展示技术视野
  • 突出GPGPU/NPU相关项目经验,尤其是驱动开发、Firmware或性能优化案例
  • 详细描述你在Linux系统编程、内存管理和并发方面的实践经验
  • 展示对CUDA/ROCm软件栈的熟悉程度,以及参与AI框架或模型优化的经历
  • 如有跨团队协作或项目管理经验,强调领导力和沟通能力
  • 深入学习计算机体系结构,尤其是GPU/NPU的微架构和指令集
  • 动手实践Linux内核编程和驱动开发,阅读开源驱动代码

面试指南

  • 对于架构类问题,先画出层次图,然后分层阐述功能和交互,最后举例说明实际应用
  • 对于优化类问题,遵循“定位瓶颈→提出方案→实施验证→量化收益”的逻辑,结合具体数据
  • 对于经验类问题,采用STAR法则(情境、任务、行动、结果),突出个人贡献和关键决策
  • 请详细解释GPGPU/NPU的典型软硬件分层架构及各自职责
  • 你在Linux驱动开发中如何管理内存和DMA传输?遇到过哪些问题?
  • 如何优化一个深度学习推理算子在NPU上的性能?给出具体方法
  • 描述一次你进行软硬件协同调试的经历,如何定位并解决性能瓶颈?
  • 你如何看待CUDA和ROCm的异同?在移植中可能遇到哪些挑战?

匹配度报告

71
综合匹配度

大厂AI芯片核心研发,技术前沿且成长迅猛,但工作生活平衡可能较弱。

适合人群
该职位最适合追求前沿技术成长、愿意投入高强度学习与工作的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利75
成长发展90
工作生活50
使命价值70

薪资福利匹配

75中等

字节跳动作为互联网大厂,提供有竞争力的薪酬和福利,但JD未明确薪资范围,信号一般。

薪资信号未披露(AI估算:30K-50K/月)

成长发展匹配

90较高

该岗位处于AI芯片前沿技术领域,涉及底层软硬件协同,技术成长空间极大,但JD未提及正式培训或晋升通道。

技术前沿前沿/新兴技术
技术栈GPGPU、NPU、CUDA、ROCm、Firmware、Linux驱动
业务类型ambiguous

工作生活匹配

50较低

工作地点在深圳,现场办公,JD未提及弹性工作或WLB信息,互联网大厂芯片团队通常有一定加班文化。

工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值匹配

70中等

AI芯片属于高速增长赛道,技术推动产业进步,社会影响力中等,但JD未强调使命或社会价值。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 增长算法工程师-抖音直播

    字节跳动 · 北京市
    AI 估算 · 30k-60k
  • 用户产品经理(同城Tab方向)-TikTok生活服务

    字节跳动 · 上海市
    AI 估算 · 15k-25k
  • 推荐算法专家-抖音推荐技术

    字节跳动 · 北京市
    AI 估算 · 35k-55k
  • 服务器装备测试/Diag 工程师

    字节跳动 · 北京市
    AI 估算 · 30k-50k
  • 服务器硬件研发维护专家-Data

    字节跳动 · 深圳市
    AI 估算 · 30k-50k

相似职位推荐

  • 【快Star】大模型系统开发工程师

    快手 · 北京市
    AI 估算 · 25k-35k
  • 【快Star】推荐大模型训练引擎研发工程师

    快手 · 北京市
    AI 估算 · 30k-60k
  • 【快Star】多模态推理平台工程师

    快手 · 北京市
    AI 估算 · 25k-45k
  • 【快Star】增长激励算法工程师

    快手 · 北京市
    AI 估算 · 35k-60k
  • 【快Star】混合云AI推理工程师

    快手 · 北京市
    AI 估算 · 30k-50k

字节跳动 的其他在招职位

  • 增长算法工程师-抖音直播

    字节跳动 · 北京市
    AI 估算 · 30k-60k
  • 用户产品经理(同城Tab方向)-TikTok生活服务

    字节跳动 · 上海市
    AI 估算 · 15k-25k
  • 推荐算法专家-抖音推荐技术

    字节跳动 · 北京市
    AI 估算 · 35k-55k
  • 服务器装备测试/Diag 工程师

    字节跳动 · 北京市
    AI 估算 · 30k-50k
  • 服务器硬件研发维护专家-Data

    字节跳动 · 深圳市
    AI 估算 · 30k-50k

相似职位推荐

  • 【快Star】大模型系统开发工程师

    快手 · 北京市
    AI 估算 · 25k-35k
  • 【快Star】推荐大模型训练引擎研发工程师

    快手 · 北京市
    AI 估算 · 30k-60k
  • 【快Star】多模态推理平台工程师

    快手 · 北京市
    AI 估算 · 25k-45k
  • 【快Star】增长激励算法工程师

    快手 · 北京市
    AI 估算 · 35k-60k
  • 【快Star】混合云AI推理工程师

    快手 · 北京市
    AI 估算 · 30k-50k