Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
AI加速软件资深研发工程师-芯片研发
立即应聘

AI加速软件资深研发工程师-芯片研发

发布于 2 天前

普通员工/个人贡献者

西安市
高级经验
全职员工
仅现场办公
硕士
研究与开发 (研发)
性能优化
CUDA
RDMA
量化
NCCL
分布式训练
推理
大模型
蒸馏

AI 估算 · 30k–50k

大模型芯片研发为高薪赛道,字节跳动薪酬竞争力强,西安地区资深岗位月薪约30-50K。

职位详情

关于这个职位

该职位负责字节跳动自研AI芯片上的大模型性能评估与软硬件协同优化,涵盖分布式训练/推理、算子优化、模型压缩等方向

作为资深工程师,需主导技术攻关并推动跨团队协作,属于前沿AI基础设施赛道

最低要求

计算机/电子工程相关专业,硕士学位及以上优先,4年以上AI编译器、算子或高性能通信相关研发经验

深入理解AI加速硬件体系结构与并行计算,精通多层级存储、片上NOC与片间互联原理,能从体系结构视角驱动软硬件协同设计
精通C/C++与Python,具备扎实的算法功底与大型软件系统的架构设计、性能优化能力
深入掌握主流深度学习框架的底层计算与运行时机制,对常见算子的底层实现有深刻理解
具备技术领导力与较强自驱力,能独立牵引复杂技术攻关,沟通协作与问题分析解决能力优秀

工作职责

负责大模型在自研AI芯片上的性能评估与软硬件协同优化,主导方案设计、计算、通信全链路适配和调优

对接算法,负责字节跳动大模型例如豆包、Seedance等在自研硬件不同分布式方案设计性能评估、roofline建模和集群成本分析等,协助业务落地的软硬件协同设计
负责高性能计算算子与集合通信算子的设计、实现与优化,主导大模型分布式训练/推理场景下计算与通信的融合及重叠优化,追求极致的端到端吞吐与性价比
负责模型量化、稀疏、蒸馏等部署方案的探索与落地,构建分布式推理系统并对推理框架做极致调优
牵引关键技术难题攻关,制定技术路线,指导并培养团队成员,推动跨团队(算法、框架、驱动、硬件、芯片验证)协同与自研软件栈的架构演进
主动探索针对硬件,创新的部署方案和软件栈方案设计

优先资格

深入理解LLM与多模态模型(如Qwen、DeepSeek等),有大模型分布式训练/推理框架的研发与调优经验,有大模型训练千卡以上集群训练落地经验

熟悉NCCL、DeepEP等集合通信库与RDMA原理,有自研集合通信库或芯片互联的研发与优化经验
熟悉GPU或主流AI DSA体系结构与CUDA等异构编程模型,有算子优化、图编译优化或硬件评测的实战经验
有AI加速硬件量化工具的开发经验,熟悉模型量化、稀疏、剪枝、蒸馏等压缩技术的落地
熟悉AI服务器与集群架构,对多层级卡间互联Topo有实践经验,有大规模分布式部署落地经历

AI 洞察

优缺点分析

优点

  • 前沿技术栈:直接参与大模型与自研芯片的协同优化,接触最顶级的AI基础设施
  • 稀缺性:AI芯片软硬协同方向人才稀缺,职业竞争力强,薪资溢价高
  • 技术壁垒高:需同时理解芯片架构、分布式系统和AI算法,学习曲线陡峭
  • 适合拥有深厚系统编程和AI加速经验、热爱技术攻关、愿意深耕芯片软件栈的资深工程师

缺点 / 挑战

  • 平台优势:字节跳动拥有海量业务场景和算力资源,技术挑战大,成长空间广阔
  • 工作强度大:面临业务快速迭代和极致性能追求,可能需应对高压力攻关
  • 跨团队协同复杂:需要与算法、驱动、硬件等多团队紧密协作,沟通成本较高

角色解读

  • 技术深耕:成为AI芯片软件栈领域的专家,主导下一代软硬件协同设计
  • 管理转型:从技术负责人逐步向技术总监或架构师发展,带领更大团队
  • 横向扩展:拓展到AI框架、分布式系统或芯片设计等关联领域,成为全栈AI系统专家
  • 主导大模型在自研AI芯片上的性能评估与软硬件协同优化,设计分布式方案并计算、通信全链路调优
  • 负责高性能计算与集合通信算子的设计与优化,提升分布式训练/推理的端到端吞吐与性价比
  • 探索模型量化、稀疏、蒸馏等压缩技术的落地,构建并调优分布式推理系统
  • 牵引关键技术攻关,制定技术路线,指导团队并推动跨部门协同与软件栈演进
  • 精通AI加速硬件体系结构与并行计算,理解多层级存储、片上互联和片间互联
  • 精通C/C++与Python,具备大型软件系统架构设计与性能优化能力
  • 深入掌握主流深度学习框架底层机制,熟悉算子实现与运行时
  • 具备技术领导力,能独立牵引复杂技术攻关并推动跨团队协作

申请策略

  • 在简历中量化成果,如'将推理延迟降低30%',体现对性能的极致追求
  • 面试前了解字节自研芯片(如火山引擎相关)的技术动态,展现兴趣与匹配度
  • 突出AI编译器、算子优化或高性能通信方面的项目经验,附具体性能提升数据
  • 强调大规模分布式训练/推理的落地案例,如千卡级集群调优经历
  • 展示对AI芯片体系结构的理解,如NOC、存算一体、多级缓存等优化经验
  • 注明技术领导力体现,如主导技术方案、指导新人或跨团队协作成果
  • 系统学习CUDA编程与GPU架构,掌握常用算子优化技巧
  • 深入研究NCCL/DeepEP等集合通信库源码,理解RDMA原理

面试指南

  • 技术问题采用STAR法则:明确场景、目标、行动、结果,重点突出系统级优化思考
  • 开放性问题先澄清约束条件,再分层拆解(计算/内存/通信),最后给出可落地方案
  • 团队协作问题强调沟通技巧和定义问题边界,展示技术领导力
  • 如何优化一个Transformer层在自研芯片上的前向推理?请从计算与访存角度分析
  • 请介绍你曾主导的大规模分布式训练方案,如何解决通信瓶颈?
  • 解释Roofline模型如何指导软硬件协同设计,并举例说明
  • 比较量化与稀疏化两种压缩方法在推理加速中的优劣
  • 你如何推动跨团队(算法、驱动、硬件)解决一个复杂性能问题?

匹配度报告

72
综合匹配度

字节自研芯片团队,前沿技术栈,薪资竞争力强,但工作强度较大,WLB一般。

适合人群
适合追求技术前沿、渴望在AI芯片领域深度成长、能接受较高工作强度的开发者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利80
成长发展90
工作生活50
使命价值70

薪资福利匹配

80较高

字节跳动薪酬在业界具有较强竞争力,西安地区资深芯片研发岗位月薪约30-50K且含年终奖,但JD未明确具体福利,薪资信号为市场水准。

薪资信号市场水准 (30K-50K/月)

成长发展匹配

90较高

该职位聚焦前沿AI芯片与大模型技术,技术栈先进,有明确的技术攻关和团队指导职责,成长空间大。JD提及'指导培养团队成员'和'技术路线制定',但未明确晋升通道。

技术前沿前沿/新兴技术
技术栈AI加速、大模型、芯片、分布式训练、量化、稀疏、蒸馏、NCCL、RDMA、CUDA
成长机会指导培养团队成员、制定技术路线
业务类型profit_center

工作生活匹配

50较低

工作地点在西安,要求现场办公,JD未提及弹性工作或远程,互联网大厂通常工作强度较高,WLB信号不明确。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值匹配

70中等

AI芯片和大模型属于高速增长赛道,字节跳动自研芯片对业务有战略意义,技术影响力和社会价值中等偏上,但JD未强调使命或社会影响。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 商家BD-抖音生活服务

    字节跳动 · 成都市
    AI 估算 · 10k-20k
  • 商家BD-抖音生活服务

    字节跳动 · 三亚市
    AI 估算 · 8k-20k
  • 商家BD-抖音生活服务

    字节跳动 · 东莞市
    AI 估算 · 8k-15k
  • 算法工程师-地理位置中台(北京/上海/深圳)

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • AI素材创意策划-ONE Studio

    字节跳动 · 北京市
    AI 估算 · 20k-35k

相似职位推荐

  • AI大模型算法实习生-2027届

    小米 · 北京市
    AI 估算 · 5k-8k
  • 商业算法实习生—base上海通用岗

    小红书 · 上海市
    AI 估算 · 4k-10k
  • 企业微信-评测算法工程师-(北京/成都)

    腾讯 · 北京市
    AI 估算 · 25k-45k
  • Diagnostic Architecture

    大众汽车 · 合肥市
    AI 估算 · 15k-25k
  • R&DWhere your curiosity drives the miracles of science

    赛诺菲 · 苏州市
    AI 估算 · 35k-50k

字节跳动 的其他在招职位

  • 商家BD-抖音生活服务

    字节跳动 · 成都市
    AI 估算 · 10k-20k
  • 商家BD-抖音生活服务

    字节跳动 · 三亚市
    AI 估算 · 8k-20k
  • 商家BD-抖音生活服务

    字节跳动 · 东莞市
    AI 估算 · 8k-15k
  • 算法工程师-地理位置中台(北京/上海/深圳)

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • AI素材创意策划-ONE Studio

    字节跳动 · 北京市
    AI 估算 · 20k-35k

相似职位推荐

  • AI大模型算法实习生-2027届

    小米 · 北京市
    AI 估算 · 5k-8k
  • 商业算法实习生—base上海通用岗

    小红书 · 上海市
    AI 估算 · 4k-10k
  • 企业微信-评测算法工程师-(北京/成都)

    腾讯 · 北京市
    AI 估算 · 25k-45k
  • Diagnostic Architecture

    大众汽车 · 合肥市
    AI 估算 · 15k-25k
  • R&DWhere your curiosity drives the miracles of science

    赛诺菲 · 苏州市
    AI 估算 · 35k-50k