Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

ByteDance logo
字节跳动
AI芯片系统软件SDK/Tools工程师-系统软件
立即应聘

AI芯片系统软件SDK/Tools工程师-系统软件

发布于 1 天前

普通员工/个人贡献者

深圳市
专家级经验
全职员工
仅现场办公
本科
软件工程
全栈开发
系统监控
调试工具
Linux内核驱动
NPU
GPGPU
Cuda-Gdb
Nvml

AI 估算 · 30k–50k

字节跳动大厂+AI芯片赛道稀缺技能+深圳,薪资竞争力强,月薪30k-50k合理

职位详情

关于这个职位

该职位负责字节跳动AI芯片的系统级监控软件、运维及调试工具开发,涉及用户态与驱动全栈,并参与集群可维可测平台建设

适合有Linux内核驱动和GPGPU/NPU经验的资深工程师,工作内容前沿且具有挑战性

最低要求

计算机/自动化相关专业本科及以上学历

熟练掌握至少一种编程语言,如C、C++等,熟练掌握Linux系统编程,了解ELF文件格式与相关工具的使用
有Linux内核驱动开发经验,熟悉Linux操作系统下的驱动开发流程
有GPGPU/NPU芯片相关领域的工作经验,熟悉Nvml/NVIDIA-smi/CUDA-gdb等软件,理解其在监控、调试与性能分析中的应用
具有良好的团队合作精神和沟通能力,能够与跨部门团队(如硬件团队、算法团队等)紧密协作,共同推进项目进展

工作职责

负责AI芯片系统级监控软件以及运维、调试工具的架构设计与开发,覆盖用户态应用与设备驱动的全栈开发与优化

参与并推进集群级可维可测平台的建设与演进,完善关键指标采集与可视化,构建自动化故障检测、定位与诊断能力
持续跟踪GPGPU、NPU行业前沿动态与内部业务需求,输出软硬件协同的可维可测解决方案,并推动方案落地

优先资格

具备GPGPU/NPU监控软件、运维与调试工具开发的实战经验

AI 洞察

优缺点分析

优点

  • 参与AI芯片自研,技术前沿且门槛高,积累底层系统经验极具价值
  • 字节跳动平台资源丰富,项目影响力大,可接触大规模集群运维场景
  • 薪资和福利在业内具有竞争力,股票期权等激励优厚
  • 涉及全栈开发,对Linux内核、驱动、用户态等要求高,学习曲线陡峭
  • 工作强度可能较大,需要快速迭代和响应线上问题

缺点 / 挑战

  • 芯片行业迭代快,需持续跟踪前沿技术,保持学习压力
  • 适合具有Linux内核和GPGPU/NPU背景、热爱底层系统技术、渴望挑战的资深工程师

角色解读

  • 深入AI芯片底层技术栈,成为系统软件专家,可向架构师方向发展
  • 积累集群运维和大规模可观测性经验,转向基础设施或SRE管理方向
  • 芯片方向稀缺性强,可跳槽至其他AI芯片公司或云计算大厂
  • 设计开发AI芯片的监控软件和调试工具,覆盖用户态应用与内核驱动全栈
  • 参与构建集群级可维可测平台,实现关键指标采集、可视化和自动化故障诊断
  • 跟踪GPGPU/NPU前沿技术,制定软硬件协同的监控运维方案并推动落地
  • 精通C/C++和Linux系统编程,熟悉ELF文件格式及相关工具
  • 具备Linux内核驱动开发经验,熟悉驱动开发流程
  • 有GPGPU/NPU相关经验,熟悉Nvml、NVIDIA-smi、CUDA-gdb等监控调试软件

申请策略

  • 准备1-2个具体的监控或调试工具开发案例,详细说明架构设计和难点解决
  • 了解字节跳动AI芯片业务方向(如Pico、火山引擎等),在面试中体现兴趣
  • 突出Linux内核驱动开发项目经验,尤其是性能优化或调试工具开发
  • 强调GPGPU/NPU相关工作经验,具体描述使用过Nvml、CUDA-gdb等工具的成果
  • 展示全栈开发能力,包括用户态和驱动层协同工作的案例
  • 复习Linux内核驱动框架(如字符设备、IOCTL、mmap等),准备相关面试题
  • 深入了解NVIDIA GPU监控体系(Nvml、DCGM等),对比NPU类似方案
  • 补充可观测性相关知识,如Prometheus、Grafana、ELK等

面试指南

  • 采用STAR原则:情境-任务-行动-结果,突出技术决策和量化成果
  • 对于设计类问题,先明确需求范围,再给出分层架构,最后评估取舍
  • 准备系统编程相关的底层原理回答,如mmap、DMA、中断等
  • 请描述你之前开发的Linux内核驱动模块,如何处理并发和性能问题?
  • 如何设计一个监控GPGPU/NPU芯片的系统软件,需要采集哪些指标?
  • 解释Nvml的工作原理,以及如何扩展支持自定义监控项?
  • 遇到内核崩溃或设备挂起时,你如何进行调试和定位?
  • 谈谈你对GPGPU/NPU可维可测性的理解,以及业界主流方案

职位点评

74
综合评分

大厂AI芯片底层系统岗,前沿技术栈、薪资高,但加班可能较多。

更适合这类人
该职位最适合追求技术成长和薪酬回报、能接受高强度工作的求职者。
表现最好
成长发展
相对薄弱
工作生活
薪资福利88
成长发展92
工作生活40
使命价值78

薪资福利

88较高

字节跳动薪资福利在行业具有竞争力,但JD未提及具体薪资福利细节;作为已上市大厂,整体补偿性动机满足度较高。

薪资信号未披露(AI估算:30K-50K/月)

成长发展

92较高

该职位涉及AI芯片系统软件前沿技术,能显著提升底层开发能力;JD虽未明确晋升通道,但字节内部成长空间大。

技术前沿前沿/新兴技术
技术栈C、C++、Linux内核驱动、GPGPU、NPU、Nvml、CUDA-gdb
业务类型profit_center

工作生活

40较低

JD明确要求现场办公,未提及弹性工时或远程,且字节跳动以高强度著称,生活化动机满足度较低。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值

78中等

AI芯片是高速增长赛道,对国产芯片自主可控有重要社会价值,但JD未直接提及使命感。

行业发展高速增长赛道
社会影响正向社会影响力较高
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 客户端安全工程师

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 区域配送商务Leader-TikTok Shop

    字节跳动 · 上海市
    AI 估算 · 50k-80k
  • 零售行业高级解决方案经理-火山引擎

    字节跳动 · 北京市
    AI 估算 · 30k-50k
  • C端内容产品设计师-生活服务(上海)

    字节跳动 · 上海市
    AI 估算 · 20k-40k
  • 云原生产品专家-微服务

    字节跳动 · 上海市
    AI 估算 · 35k-60k

相似职位推荐

  • 平台开发工程师

    中国移动 · 北京市
    AI 估算 · 20k-35k

字节跳动 的其他在招职位

  • 客户端安全工程师

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 区域配送商务Leader-TikTok Shop

    字节跳动 · 上海市
    AI 估算 · 50k-80k
  • 零售行业高级解决方案经理-火山引擎

    字节跳动 · 北京市
    AI 估算 · 30k-50k
  • C端内容产品设计师-生活服务(上海)

    字节跳动 · 上海市
    AI 估算 · 20k-40k
  • 云原生产品专家-微服务

    字节跳动 · 上海市
    AI 估算 · 35k-60k

相似职位推荐

  • 平台开发工程师

    中国移动 · 北京市
    AI 估算 · 20k-35k