Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
AI加速软件资深研发工程师-芯片研发
立即应聘

AI加速软件资深研发工程师-芯片研发

发布于 5 天前

普通员工/个人贡献者

北京市
高级经验
全职员工
仅现场办公
硕士
软件工程
性能优化
深度学习框架
CUDA
RDMA
NCCL
模型量化
AI芯片
分布式训练
大模型

AI 估算 · 50k–80k

字节跳动资深技术岗,北京地区AI芯片热门方向,技术难度高,薪资具备市场竞争力。

职位详情

关于这个职位

该职位负责大模型在字节自研AI芯片上的性能评估与软硬件协同优化,包括算子设计、分布式训练/推理调优、模型压缩等

工作涉及算法、框架、硬件多团队协作,要求深厚的技术功底和系统优化能力,是AI芯片落地核心岗位

最低要求

计算机/电子工程相关专业,硕士学位及以上优先,4年以上AI编译器、算子或高性能通信相关研发经验

深入理解AI加速硬件体系结构与并行计算,精通多层级存储、片上NOC与片间互联原理,能从体系结构视角驱动软硬件协同设计
精通C/C++与Python,具备扎实的算法功底与大型软件系统的架构设计、性能优化能力
深入掌握主流深度学习框架的底层计算与运行时机制,对常见算子的底层实现有深刻理解
具备技术领导力与较强自驱力,能独立牵引复杂技术攻关,沟通协作与问题分析解决能力优秀

工作职责

负责大模型在自研AI芯片上的性能评估与软硬件协同优化,主导方案设计、计算、通信全链路适配和调优

对接算法,负责字节跳动大模型例如豆包、Seedance等在自研硬件不同分布式方案设计性能评估、roofline建模和集群成本分析等,协助业务落地的软硬件协同设计
负责高性能计算算子与集合通信算子的设计、实现与优化,主导大模型分布式训练/推理场景下计算与通信的融合及重叠优化,追求极致的端到端吞吐与性价比
负责模型量化、稀疏、蒸馏等部署方案的探索与落地,构建分布式推理系统并对推理框架做极致调优
牵引关键技术难题攻关,制定技术路线,指导并培养团队成员,推动跨团队(算法、框架、驱动、硬件、芯片验证)协同与自研软件栈的架构演进
主动探索针对硬件,创新的部署方案和软件栈方案设计

优先资格

深入理解LLM与多模态模型(如Qwen、DeepSeek等),有大模型分布式训练/推理框架的研发与调优经验,有大模型训练千卡以上集群训练落地经验

熟悉NCCL、DeepEP等集合通信库与RDMA原理,有自研集合通信库或芯片互联的研发与优化经验
熟悉GPU或主流AI DSA体系结构与CUDA等异构编程模型,有算子优化、图编译优化或硬件评测的实战经验
有AI加速硬件量化工具的开发经验,熟悉模型量化、稀疏、剪枝、蒸馏等压缩技术的落地
熟悉AI服务器与集群架构,对多层级卡间互联Topo有实践经验,有大规模分布式部署落地经历

AI 洞察

优缺点分析

优点

  • 参与自研AI芯片的前沿项目,接触软硬件全栈技术,技能积累快
  • 字节跳动平台资源丰富,大模型业务场景多,技术落地机会广泛
  • 与顶尖算法、硬件、驱动团队协作,能大幅提升系统思维和影响力
  • 薪资福利待遇优厚,职业成长空间大
  • 技术难度高,需要同时具备硬件体系结构、并行计算、模型优化等多领域知识
  • 作为资深岗位,需要承担技术决策和跨团队协调责任,对自驱力要求高

缺点 / 挑战

  • 工作强度较大,项目周期紧,可能面临加班压力
  • 适合在AI加速、高性能计算领域有深厚经验,渴望挑战前沿技术并推动软硬件协同创新的人

角色解读

  • 技术专家方向:深入AI芯片软件栈,成为软硬件协同设计领域的权威
  • 架构师方向:主导下一代芯片的软件架构设计,影响产品路线图
  • 管理方向:从技术领导力过渡到团队管理,带领更多人攻克难题
  • 负责大模型在自研AI芯片上的性能评估与软硬件协同优化,包括计算、通信全链路调优
  • 设计并优化高性能计算算子和集合通信算子,提升分布式训练/推理效率
  • 探索模型量化、稀疏、蒸馏等部署方案,构建极致性能的推理系统
  • 牵引技术攻关,指导团队成员,推动跨团队协同与软件栈架构演进
  • 精通C/C++和Python,具备大型系统架构设计和性能优化能力
  • 深入理解AI加速硬件体系结构,如多级存储、片上互联、并行计算
  • 熟悉主流深度学习框架底层机制,能优化算子实现
  • 掌握分布式训练框架和大模型推理优化技术,如NCCL、RDMA

申请策略

  • 在简历中突出与职位描述直接相关的项目,用量化指标展示成果
  • 提前了解字节跳动自研AI芯片(如RSC)的技术方向,在面试中展现兴趣和见解
  • 重点突出大模型分布式训练/推理优化的项目成果,尤其是性能提升数据
  • 强调对AI芯片或GPU体系结构的理解,以及实际优化经验
  • 展示量化、稀疏等模型压缩技术的落地案例
  • 如果有指导团队或跨团队协作经历,务必说明
  • 深入理解LLM和多模态模型结构,熟悉主流推理框架(如vLLM、TensorRT-LLM)
  • 学习NCCL、RDMA等通信库原理,了解芯片互联拓扑

面试指南

  • STAR方法:描述背景、任务、行动和结果,突出技术深度和量化收益
  • 分层回答:从硬件、算法、工程角度分析问题,体现系统性思维
  • 对比分析:对比不同方案优劣,展示决策依据
  • 请描述你过去优化大模型训练性能的具体案例,包括问题、方法和效果
  • 如何对大模型进行Roofline建模?请举例说明
  • 谈谈你对NCCL的理解,如何优化跨节点通信?
  • 模型量化有哪些常用技术?在部署时如何平衡精度和性能?
  • 你如何看待软硬件协同设计?在自研芯片背景下有哪些挑战?

匹配度报告

70
综合匹配度

字节跳动自研AI芯片核心岗位,技术前沿、薪资高,但工作强度大。

适合人群
最适合追求技术成长和前沿挑战的求职者,对工作生活平衡要求较低的人。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展95
工作生活30
使命价值70

薪资福利匹配

85较高

字节跳动资深岗位薪资处于市场高位,但JD未明确提及福利细节,整体补偿性较强。

薪资信号偏高 (50K-80K/月)

成长发展匹配

95较高

职位涉及自研AI芯片等前沿技术,成长空间大,有技术攻关和指导职责,发展性极高。

技术前沿前沿/新兴技术
技术栈大模型、AI芯片、分布式训练、NCCL、RDMA、模型量化、稀疏计算
成长机会指导并培养团队成员
业务类型profit_center

工作生活匹配

30较低

仅现场办公,JD未提及弹性工时或WLB,典型大厂高强度岗位,生活化满足度低。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

70中等

AI芯片方向属于高速增长赛道,技术影响力大,但社会价值偏中性,意义感中等。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 商家BD-抖音生活服务

    字节跳动 · 成都市
    AI 估算 · 10k-20k
  • 商家BD-抖音生活服务

    字节跳动 · 三亚市
    AI 估算 · 8k-20k
  • 商家BD-抖音生活服务

    字节跳动 · 东莞市
    AI 估算 · 8k-15k
  • 算法工程师-地理位置中台(北京/上海/深圳)

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • AI素材创意策划-ONE Studio

    字节跳动 · 北京市
    AI 估算 · 20k-35k

相似职位推荐

  • AI全栈工程师(AI Coding 方向)

    小红书 · 北京市
    AI 估算 · 45k-70k
  • 智能体-全栈开发专家-CodeBuddy/WorkBuddy

    腾讯 · 深圳市
    AI 估算 · 40k-70k
  • 智能体-全栈开发专家-CodeBuddy/WorkBuddy

    腾讯 · 深圳市
    AI 估算 · 30k-60k
  • 高级/资深iOS开发工程师(MJ035494)

    携程 · 上海市
    AI 估算 · 25k-45k
  • Staff Machine Learning Engineer, ML Infrastructure - Offline

    Unity Technologies · 上海市
    AI 估算 · 40k-70k

字节跳动 的其他在招职位

  • 商家BD-抖音生活服务

    字节跳动 · 成都市
    AI 估算 · 10k-20k
  • 商家BD-抖音生活服务

    字节跳动 · 三亚市
    AI 估算 · 8k-20k
  • 商家BD-抖音生活服务

    字节跳动 · 东莞市
    AI 估算 · 8k-15k
  • 算法工程师-地理位置中台(北京/上海/深圳)

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • AI素材创意策划-ONE Studio

    字节跳动 · 北京市
    AI 估算 · 20k-35k

相似职位推荐

  • AI全栈工程师(AI Coding 方向)

    小红书 · 北京市
    AI 估算 · 45k-70k
  • 智能体-全栈开发专家-CodeBuddy/WorkBuddy

    腾讯 · 深圳市
    AI 估算 · 40k-70k
  • 智能体-全栈开发专家-CodeBuddy/WorkBuddy

    腾讯 · 深圳市
    AI 估算 · 30k-60k
  • 高级/资深iOS开发工程师(MJ035494)

    携程 · 上海市
    AI 估算 · 25k-45k
  • Staff Machine Learning Engineer, ML Infrastructure - Offline

    Unity Technologies · 上海市
    AI 估算 · 40k-70k