Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

ByteDance logo
字节跳动
AI芯片互联软件工程师-Data
立即应聘

AI芯片互联软件工程师-Data

发布于 1 天前

普通员工/个人贡献者

上海市
中级经验
全职员工
仅现场办公
本科
软件工程
系统编程
RDMA
NCCL
NVLINK
Linux内核驱动
AI芯片
GPGPU
多卡互联
Roce V2

AI 估算 · 30k–60k

AI芯片方向技能稀缺,大厂薪资竞争力强,市场行情中上水平。

职位详情

关于这个职位

该职位负责AI芯片多卡互联方案的设计与开发,包括驱动程序、软件栈和系统验证

你将与硬件和算法团队协作,优化多卡协同性能,跟踪前沿技术
适合有Linux驱动和高速互联经验的技术专家

最低要求

计算机/电子信息工程相关专业本科及以上学历

熟练掌握至少一种编程语言,如C、C++等,熟练掌握Linux系统编程
有Linux内核驱动开发经验,熟练Linux操作系统下的驱动开发流程
至少2年以上AI芯片/GPGPU芯片/RDMA网卡芯片或者相关领域的工作经验
对多卡互联技术有深入的理解,包括不限于NVLink、SUE、RDMA或者其他高速互联接口协议
掌握RDMA网卡的驱动开发,熟悉TCP/IP协议,熟悉RoCE V2协议
熟悉NCCL等集合通信库的原理以及使用
具有良好的团队合作精神和沟通能力,能够与跨部门团队(如硬件团队、算法团队等)紧密协作

工作职责

参与AI芯片多卡互联方案的设计与开发,开发和优化多卡互联的软件驱动程序,实现多卡之间的协同工作

参与多卡互联系统的验证与调试,及时发现并解决在测试过程中出现的各种问题
参与AI芯片互联相关软件栈开发,包括Kernel Mode Driver/User Mode Driver/SDK/Tools等
跟踪行业最新技术动态,为公司的AI芯片多卡互联技术发展提供前瞻性的建议和技术储备

优先资格

理解LLM网络模型结构,熟悉模型部署、分析和优化

擅长跨团队沟通交流协作,有项目或团队管理经验

AI 洞察

优缺点分析

优点

  • 身处AI芯片核心领域,技术前沿且需求旺盛,个人价值提升快
  • 字节跳动平台资源丰富,能接触大规模分布式训练场景,实践机会多
  • 团队技术氛围浓厚,与硬件和算法团队紧密协作,技能成长全面
  • AI芯片技术迭代快,需要持续学习,工作强度可能较大
  • 涉及底层驱动和硬件交互,问题定位难度高,对耐心和细心要求高
  • 跨团队协作频繁,沟通成本高,需要较强的协调能力
  • 适合热爱底层系统、对AI芯片和高速互联有浓厚兴趣,并愿意在技术深度上不断精进的工程师

缺点 / 挑战

暂无明显挑战项

角色解读

  • 从互联软件工程师向AI芯片系统架构师发展,主导整体互联方案设计
  • 向技术专家方向深入,成为RDMA/NVLink等领域的权威
  • 转型AI芯片全栈开发,涵盖编译器、运行时和框架优化
  • 设计和开发AI芯片的多卡互联软件驱动,实现多卡间的协同工作
  • 参与互联系统的验证与调试,解决测试中的性能问题
  • 开发完整的软件栈,包括内核驱动、用户态驱动、SDK和工具
  • 跟踪行业前沿技术,为芯片互联方案提供技术储备
  • 精通C/C++和Linux系统编程,具备内核驱动开发经验
  • 深入理解多卡互联技术,熟悉NVLink、RDMA等高速互联协议
  • 掌握NCCL等集合通信库的原理和使用
  • 了解AI芯片架构和LLM网络模型,具备系统优化能力

申请策略

  • 面试前准备一个多卡互联的完整项目案例,从问题到解决方案
  • 关注字节跳动在AI芯片领域的公开技术分享,体现对业务的了解
  • 突出Linux内核驱动开发经验,列出具体项目(如RDMA驱动、NVLink调试)
  • 强调对多卡互联协议的理解,附上相关技术博客或开源贡献
  • 体现AI芯片或GPGPU相关工作经历,尤其是性能优化案例
  • 展示团队协作和项目管理能力,特别是跨角色合作经验
  • 深入学习RDMA和NVLink协议栈,动手搭建测试环境
  • 掌握NCCL原理及性能调优方法,阅读源码

面试指南

  • 对于协议对比类问题,先给出定义,再比较优缺点,最后举例说明应用场景
  • 对于调试类问题,按照“现象-排查-定位-解决”的步骤叙述,突出系统性和工具使用
  • 对于性能优化类问题,使用量化指标(如带宽、延迟),并强调迭代优化过程
  • 请详细解释NVLink和RDMA的区别及适用场景
  • 你如何调试一个Linux内核驱动导致的系统崩溃?
  • 描述一次优化多卡通信性能的经历,用了哪些工具和指标?
  • NCCL的AllReduce实现原理是什么?如何针对特定拓扑优化?
  • 你对LLM模型部署中的通信瓶颈有什么理解?

职位点评

74
综合评分

大厂AI芯片方向,前沿技术栈,薪资高但WLB未明确。

更适合这类人
适合追求技术前沿和职业成长的工程师,对薪资和WLB要求较为适中。
表现最好
成长发展
相对薄弱
工作生活
薪资福利70
成长发展85
工作生活60
使命价值80

薪资福利

70中等

字节跳动薪资具有市场竞争力,但JD未明确薪资和福利,补偿性动机满足程度中等偏上。

薪资信号未披露(AI估算:30K-60K/月)

成长发展

85较高

AI芯片多卡互联属于前沿技术,工作内容涉及底层创新,成长空间大,发展性动机满足度高。

技术前沿前沿/新兴技术
技术栈AI芯片、多卡互联、Linux内核驱动、C++、RDMA、NVLink、NCCL、GPGPU、系统编程、RoCE V2
业务类型ambiguous

工作生活

60中等

仅现场办公,未说明WLB情况,上海办公可能通勤较长,生活化动机满足度一般。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值

80较高

AI芯片行业高速增长,技术具有创新性,能推动AI计算发展,意义感动机满足度较高。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 客户端安全工程师

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 区域配送商务Leader-TikTok Shop

    字节跳动 · 上海市
    AI 估算 · 50k-80k
  • 零售行业高级解决方案经理-火山引擎

    字节跳动 · 北京市
    AI 估算 · 30k-50k
  • C端内容产品设计师-生活服务(上海)

    字节跳动 · 上海市
    AI 估算 · 20k-40k
  • 云原生产品专家-微服务

    字节跳动 · 上海市
    AI 估算 · 35k-60k

相似职位推荐

  • 平台开发工程师

    中国移动 · 北京市
    AI 估算 · 20k-35k

字节跳动 的其他在招职位

  • 客户端安全工程师

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 区域配送商务Leader-TikTok Shop

    字节跳动 · 上海市
    AI 估算 · 50k-80k
  • 零售行业高级解决方案经理-火山引擎

    字节跳动 · 北京市
    AI 估算 · 30k-50k
  • C端内容产品设计师-生活服务(上海)

    字节跳动 · 上海市
    AI 估算 · 20k-40k
  • 云原生产品专家-微服务

    字节跳动 · 上海市
    AI 估算 · 35k-60k

相似职位推荐

  • 平台开发工程师

    中国移动 · 北京市
    AI 估算 · 20k-35k