Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
AI加速软件资深研发工程师-芯片研发
立即应聘

AI加速软件资深研发工程师-芯片研发

发布于 2 天前

普通员工/个人贡献者

深圳市
高级经验
全职员工
仅现场办公
硕士
研究与开发 (研发)
高性能计算
CUDA
RDMA
量化
AI芯片
分布式训练
推理
大模型
蒸馏

AI 估算 · 50k–80k

字节跳动资深AI芯片软件岗,技术壁垒高,深圳一线薪资水平,月薪中位数约65K。

职位详情

关于这个职位

该职位负责大模型在自研AI芯片上的性能评估与软硬件协同优化,包括从算子优化到分布式训练/推理全链路的调优

您将参与芯片软件栈的架构演进,主导关键技术攻关,并推动跨团队协作
适合对AI芯片体系结构有深入理解、擅长高性能计算与系统优化的资深工程师

最低要求

计算机、电子工程相关专业,硕士学位及以上优先,4年以上AI编译器、算子或高性能通信相关研发经验

深入理解AI加速硬件体系结构与并行计算,精通多层级存储、片上NOC与片间互联原理,能从体系结构视角驱动软硬件协同设计
精通C、C++与Python,具备扎实的算法功底与大型软件系统的架构设计、性能优化能力
深入掌握主流深度学习框架的底层计算与运行时机制,对常见算子的底层实现有深刻理解
具备技术领导力与较强自驱力,能独立牵引复杂技术攻关,沟通协作与问题分析解决能力优秀

工作职责

负责大模型在自研AI芯片上的性能评估与软硬件协同优化,主导方案设计、计算、通信全链路适配和调优

对接算法,负责字节跳动大模型例如豆包、Seedance等在自研硬件不同分布式方案设计性能评估、roofline建模和集群成本分析等,协助业务落地的软硬件协同设计
负责高性能计算算子与集合通信算子的设计、实现与优化,主导大模型分布式训练/推理场景下计算与通信的融合及重叠优化,追求极致的端到端吞吐与性价比
负责模型量化、稀疏、蒸馏等部署方案的探索与落地,构建分布式推理系统并对推理框架做极致调优
牵引关键技术难题攻关,制定技术路线,指导并培养团队成员,推动跨团队(算法、框架、驱动、硬件、芯片验证)协同与自研软件栈的架构演进
主动探索针对硬件,创新的部署方案和软件栈方案设计

优先资格

深入理解LLM与多模态模型(如Qwen、DeepSeek等),有大模型分布式训练、推理框架的研发与调优经验,有大模型训练千卡以上集群训练落地经验

熟悉NCCL、DeepEP等集合通信库与RDMA原理,有自研集合通信库或芯片互联的研发与优化经验
熟悉GPU或主流AI DSA体系结构与CUDA等异构编程模型,有算子优化、图编译优化或硬件评测的实战经验
有AI加速硬件量化工具的开发经验,熟悉模型量化、稀疏、剪枝、蒸馏等压缩技术的落地
熟悉AI服务器与集群架构,对多层级卡间互联Topo有实践经验,有大规模分布式部署落地经历

AI 洞察

优缺点分析

优点

  • 参与前沿AI芯片与自研软件栈开发,技术含金量高
  • 字节跳动平台资源丰富,大模型落地场景多,成长空间大
  • 薪资与福利具有竞争力,股票期权等长期激励
  • 技术栈深,需要持续学习最新AI芯片与分布式系统知识
  • 对系统级优化能力要求极高,调试和性能调优可能耗时

缺点 / 挑战

  • 工作强度较高,需要承担复杂技术攻关与跨团队协调压力
  • 适合有4年以上AI编译器、高性能计算或芯片软件经验的资深工程师,热爱技术挑战,追求极致的系统性能

角色解读

  • 技术专家方向:成为AI芯片软件栈架构师或首席工程师
  • 管理方向:晋升为团队负责人或技术总监,带领更大团队
  • 跨领域发展:转向AI算法、硬件设计或系统架构等方向
  • 负责大模型在自研AI芯片上的性能评估与软硬件协同优化,包括算子设计、通信优化、量化蒸馏等
  • 主导分布式训练/推理场景下的计算与通信融合,追求端到端吞吐与性价比
  • 牵引关键技术攻关,制定技术路线,指导团队并推动跨部门协作
  • 精通C/C++和Python,具备扎实的算法与系统架构能力
  • 深入理解AI加速硬件体系结构与并行计算,熟悉多层级存储和片间互联
  • 掌握主流深度学习框架底层机制,有高性能计算或编译器经验

申请策略

  • 关注字节跳动自研芯片进展,面试中展现对软硬件协同设计的理解
  • 准备一个完整的技术攻关案例,展示问题分析与解决能力
  • 突出AI芯片、编译器或高性能通信方面的项目经验,具体说明性能提升数据
  • 强调大模型分布式训练/推理的落地案例,尤其是千卡集群经验
  • 展示C++/Python系统架构设计能力,以及技术领导力
  • 补强集合通信库(如NCCL)和RDMA知识,有自研经验更佳
  • 深入学习模型量化、稀疏、蒸馏等部署技术
  • 熟悉CUDA编程与GPU体系结构,积累算子优化经验

面试指南

  • 使用STAR法则:背景、任务、行动、结果,突出量化指标
  • 从体系结构角度分析:先解释原理,再给出具体优化策略,最后展示效果
  • 结合字节跳动业务:提及豆包、Seedance等大模型场景,体现业务理解
  • 请描述一个你主导的AI芯片软件性能优化项目,具体解决了什么关键问题?
  • 大模型分布式训练中,如何设计通信拓扑与计算重叠以提升效率?
  • 你对AI芯片的存储层次和片间互联如何理解?在软硬件协同设计中如何平衡?
  • 介绍模型量化的常用方法,在芯片部署中如何选择量化方案?
  • 如何评估一个AI芯片的compute roof和memory roof?

匹配度报告

71
综合匹配度

字节跳动深圳自研AI芯片软件岗,技术前沿薪资高,但工作强度大且需现场办公。

适合人群
适合追求技术前沿与高薪资、能接受高强度工作的资深工程师。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展90
工作生活40
使命价值70

薪资福利匹配

85较高

字节跳动薪资待遇行业领先,资深岗位薪酬丰厚,但JD未明确薪资细节。

薪资信号未披露(AI估算:50K-80K/月)

成长发展匹配

90较高

该职位专注于前沿AI芯片与大模型,技术前沿性强,成长路径清晰,且JD提及指导团队,具备发展空间。

技术前沿前沿/新兴技术
技术栈大模型、AI芯片、软硬件协同、分布式训练、量化、稀疏、蒸馏、RDMA、CUDA
成长机会指导并培养团队成员
业务类型ambiguous

工作生活匹配

40较低

深圳现场办公,字节跳动加班文化普遍,JD未提及弹性工作或WLB。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值匹配

70中等

工作推动自研AI芯片落地大模型,具有技术创新价值,但社会影响力中性。

行业发展高速增长赛道
社会影响中性/一般
创新程度开拓性创新(行业首创)
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 商家BD-抖音生活服务

    字节跳动 · 成都市
    AI 估算 · 10k-20k
  • 商家BD-抖音生活服务

    字节跳动 · 三亚市
    AI 估算 · 8k-20k
  • 商家BD-抖音生活服务

    字节跳动 · 东莞市
    AI 估算 · 8k-15k
  • 算法工程师-地理位置中台(北京/上海/深圳)

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • AI素材创意策划-ONE Studio

    字节跳动 · 北京市
    AI 估算 · 20k-35k

相似职位推荐

  • AI大模型算法实习生-2027届

    小米 · 北京市
    AI 估算 · 5k-8k
  • 商业算法实习生—base上海通用岗

    小红书 · 上海市
    AI 估算 · 4k-10k
  • 企业微信-评测算法工程师-(北京/成都)

    腾讯 · 北京市
    AI 估算 · 25k-45k
  • Diagnostic Architecture

    大众汽车 · 合肥市
    AI 估算 · 15k-25k
  • R&DWhere your curiosity drives the miracles of science

    赛诺菲 · 苏州市
    AI 估算 · 35k-50k

字节跳动 的其他在招职位

  • 商家BD-抖音生活服务

    字节跳动 · 成都市
    AI 估算 · 10k-20k
  • 商家BD-抖音生活服务

    字节跳动 · 三亚市
    AI 估算 · 8k-20k
  • 商家BD-抖音生活服务

    字节跳动 · 东莞市
    AI 估算 · 8k-15k
  • 算法工程师-地理位置中台(北京/上海/深圳)

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • AI素材创意策划-ONE Studio

    字节跳动 · 北京市
    AI 估算 · 20k-35k

相似职位推荐

  • AI大模型算法实习生-2027届

    小米 · 北京市
    AI 估算 · 5k-8k
  • 商业算法实习生—base上海通用岗

    小红书 · 上海市
    AI 估算 · 4k-10k
  • 企业微信-评测算法工程师-(北京/成都)

    腾讯 · 北京市
    AI 估算 · 25k-45k
  • Diagnostic Architecture

    大众汽车 · 合肥市
    AI 估算 · 15k-25k
  • R&DWhere your curiosity drives the miracles of science

    赛诺菲 · 苏州市
    AI 估算 · 35k-50k