Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
AI芯片系统软件架构师/工程师-NPU
立即应聘

AI芯片系统软件架构师/工程师-NPU

发布于 大约 16 小时前

普通员工/个人贡献者

西安市
高级经验
全职员工
仅现场办公
本科
深度学习
CUDA
ROCm
驱动开发
NPU
GPGPU
Firmware
软硬协同

AI 估算 · 30k–60k

AI芯片行业紧缺,字节跳动平台,西安薪资低于北上但依然较高,高级岗位综合市场竞争力。

职位详情

关于这个职位

加入字节跳动自研AI芯片团队,负责NPU/GPGPU系统软件栈的架构设计与开发,包括固件、驱动、运行时及工具链

你将参与前沿存算一体技术的软硬协同优化,为字节跳动海量AI业务提供强劲算力

最低要求

本科及以上学历,计算机、体系结构等相关专业

熟悉Linux C/C++开发,有扎实的编程基础
有GPGPU/NPU芯片项目研发经验,熟悉Nvidia/AMD或国产厂家 GPU计算产品,熟悉CUDA/ROCm等GPU软件栈
熟悉计算机体系架构,对深度学习有深入的理解,对GPGPU/NPU/CIM存算体系结构至少熟悉一种,理解其微架构、主要指令集等
有GPGPU/NPU Firmware/Linux驱动开发经验,对内存管理、Kernel任务调度、RAS等有实际开发调试经验
熟悉第三方NPU IP的软件栈移植集成,结合SoC架构进行性能分析优化

工作职责

跟踪GPGPU/NPU行业最新动态、产品与技术架构,分析公司内部业务系统需求,结合自研芯片架构,输出系统软硬件协同设计方案

负责自研AI加速芯片系统软件栈的开发交付,包括芯片设备侧Firmware/Host侧驱动/系统管理诊断工具
负责自研AI加速芯片的NPU/CIM存算方向的软硬协同验证,性能分析优化,基于可编程接口进行算子用例开发
负责NPU IP的软件栈移植适配与集成,包括NPU IP的Firmware/驱动/Runtime/SDK

优先资格

加分项:

有AI相关研发经验,熟悉CUDA编程,熟悉AI框架,对一种或者多种网络模型结构有深入理解
擅长跨团队沟通交流协作,有项目或团队管理经验

AI 洞察

优缺点分析

  • 身处AI芯片这一高增长赛道,技术壁垒高,积累经验后职业前景广阔
  • 字节跳动作为头部互联网公司,技术氛围浓厚,能接触大规模业务场景
  • 岗位涉及从固件到应用的全栈,技能覆盖面广,个人成长快
  • 芯片行业技术复杂,要求同时具备硬件知识和软件工程能力,学习曲线陡峭
  • 芯片开发周期长,版本迭代慢,工作可能面临较大压力
  • 西安相比一线城市,芯片人才生态相对薄弱,可能需要更多自我驱动
  • 适合热爱底层技术、对AI芯片有浓厚兴趣,且能承受高强度研发挑战的工程师

角色解读

  • 从系统软件工程师向架构师或技术Leader发展,主导芯片软件整体设计
  • 深入AI芯片前沿领域,掌握存算一体等新技术,成为稀缺专家
  • 在字节跳动内部跨团队协作,未来可转至AI平台或数据中心相关管理岗
  • 设计并实现自研AI芯片的系统软件栈,包括固件、驱动和运行时,确保芯片高效运行
  • 跟踪GPGPU/NPU行业趋势,结合内部业务需求,制定软硬件协同优化方案
  • 负责NPU IP的软件移植与集成,进行性能分析和算子开发,提升芯片计算效率
  • 精通Linux C/C++开发,具备扎实的编程基础
  • 熟悉GPGPU/NPU体系结构,有实际芯片项目经验,掌握CUDA/ROCm等主流软件栈
  • 具有固件或驱动开发经验,理解内存管理、任务调度、RAS等底层机制

申请策略

  • 了解字节跳动的AI业务布局(如抖音、火山引擎),在面试中体现对业务价值的理解
  • 准备1-2个自己主导或深入参与的芯片软件优化案例,展示问题分析能力
  • 突出GPGPU/NPU相关的项目经验,尤其是软硬件协同设计或驱动开发部分
  • 展示C/C++编程能力,可附上GitHub或个人技术博客
  • 强调对深度学习框架或CUDA编程的熟悉程度,若有性能优化案例更佳
  • 复习计算机体系结构和操作系统核心概念,尤其是内存管理和任务调度
  • 深入学习NPU或GPGPU的微架构,阅读相关白皮书或论文
  • 动手实践Linux驱动开发,尝试编写简单的字符设备驱动或移植开源驱动

面试指南

  • 对于项目类问题,用STAR法则描述:背景、任务、行动、结果,突出技术难点和个人贡献
  • 对于技术概念题,先给出定义,再结合实际经验举例,最后延伸优化方向
  • 对于架构类问题,从整体到局部,分层描述,最后强调自己的见解
  • 请描述你参与过的GPGPU/NPU项目,你在其中承担哪些角色?
  • 解释CUDA编程模型中的grid、block、thread概念,以及如何优化显存访问?
  • Linux内核模块中,如何实现中断处理与tasklet?请举例说明
  • 当NPU执行一个深度学习算子时,主机侧和芯片侧是如何协同工作的?
  • 你如何看待存算一体架构与传统架构的差异?

匹配度报告

72
综合匹配度

字节跳动AI芯片岗位,前沿技术栈,薪资竞争力强,但工作强度未知,需接受现场办公。

适合人群
最适合追求技术前沿和职业成长,对工作生活平衡要求不高的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利80
成长发展90
工作生活50
使命价值70

薪资福利匹配

80较高

字节跳动为上市大厂,薪资在西安具有较强竞争力,但JD未明确福利,因此评分中等偏上。

薪资信号未披露 (30K-60K/月)

成长发展匹配

90较高

岗位涉及前沿AI芯片技术,个人技能成长快,但JD未提及晋升路径,扣分有限。

技术前沿前沿/新兴技术
技术栈GPGPU、NPU、CIM、CUDA、ROCm、Firmware、Linux驱动、深度学习
业务类型ambiguous

工作生活匹配

50较低

西安现场办公,JD未说明WLB,芯片行业通常有加班,因此评分较低。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值匹配

70中等

AI芯片属于高速增长赛道,对社会影响较为中性,JD无使命导向描述。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • Linux操作系统架构师

    字节跳动 · 杭州市
    AI 估算 · 50k-90k
  • 商家BD-抖音生活服务(苏州吴江)

    字节跳动 · 苏州市
    AI 估算 · 8k-15k
  • 出海品牌广告产品策略运营(亚太区域/中东区域/拉美区域)-Global Business Solutions

    字节跳动 · 上海市
    AI 估算 · 25k-45k
  • 直播工具产品经理-TikTok Shop

    字节跳动 · 上海市
    AI 估算 · 25k-45k
  • 流程合规专家-抖音生活服务

    字节跳动 · 北京市
    AI 估算 · 25k-40k

相似职位推荐

  • DFT Engineer

    博通 · 上海市
    AI 估算 · 40k-60k

字节跳动 的其他在招职位

  • Linux操作系统架构师

    字节跳动 · 杭州市
    AI 估算 · 50k-90k
  • 商家BD-抖音生活服务(苏州吴江)

    字节跳动 · 苏州市
    AI 估算 · 8k-15k
  • 出海品牌广告产品策略运营(亚太区域/中东区域/拉美区域)-Global Business Solutions

    字节跳动 · 上海市
    AI 估算 · 25k-45k
  • 直播工具产品经理-TikTok Shop

    字节跳动 · 上海市
    AI 估算 · 25k-45k
  • 流程合规专家-抖音生活服务

    字节跳动 · 北京市
    AI 估算 · 25k-40k

相似职位推荐

  • DFT Engineer

    博通 · 上海市
    AI 估算 · 40k-60k