Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
AI异构硬件推理优化专家-Seed
立即应聘

AI异构硬件推理优化专家-Seed

发布于 2 天前

普通员工/个人贡献者

上海市
中级经验
全职员工
仅现场办公
学历未注明
研究与开发 (研发)
分布式系统
高性能计算
CUDA
AI芯片
vLLM
大模型推理
算子优化

AI 估算 · 30k–60k

字节跳动AI优化专家岗位,技术含量高且需求旺盛,结合上海薪资水平及公司薪酬结构,月薪预估3-6万。

职位详情

关于这个职位

加入字节跳动 Seed 团队,专注于豆包自研大模型的推理优化

你将深入超大规模 AI 加速卡集群,参与分布式推理框架、高性能算子开发和在线稳定性建设,支撑豆包和火山引擎的核心业务流量
这是一个挑战前沿技术、推动 AI 落地的绝佳机会

最低要求

计算机、软件工程、人工智能、电子信息、微电子等相关专业优先

熟悉Linux环境下的C/C++或Python,具备扎实的编程能力和工程习惯
熟悉计算机体系结构、芯片微架构、高性能计算、分布式系统、并行计算中的至少一个方向
了解大模型推理基本流程,对Serving、调度、并发、显存管理、KV Cache或分布式推理有兴趣
关注延迟、吞吐、带宽、算力利用率、显存占用、网络通信和在线稳定性等性能问题

工作职责

该岗位面向超大规模AI加速卡集群,负责豆包Seed自研LLM模型的推理业务落地,深度参与分布式推理框架优化、高性能算子开发与在线稳定性建设,支撑豆包和火山引擎的大规模在线业务流量

业务Serving上线:参与豆包Seed自研LLM模型在超大规模AI加速卡集群上的部署、适配、性能调优和稳定性建设
推理框架优化:优化调度、Batching、KV Cache、显存管理、分布式并行、负载均衡、投机推理、稀疏计算和量化等核心链路
高性能算子与通信优化:面向不同异构硬件ISA开发和优化Attention、GEMM、量化、通算融合等关键LLM算子

优先资格

有AI芯片性能优化经验,热衷于探索不同芯片或集群的性能边界

熟悉常见的推理Serving技术栈,包括vLLM、SGLang、PagedAttention、投机推理等
有CUDA、AscendC、TileLang、Triton、CUTLASS、TVM、MLIR、TorchInductor等相关经验
具备以下经验:高性能算子开发、网络通信优化、推理引擎优化、在线服务性能优化或硬件适配
有OI/ACM、HPC竞赛、系统竞赛、科研项目或开源项目经历

AI 洞察

优缺点分析

优点

  • 字节跳动平台资源丰富,可接触到超大规模集群和前沿AI芯片
  • 团队属于核心算法部门,影响力大,个人贡献易被认可
  • 技术栈更新快,需要持续学习新硬件和新框架(如各种AI芯片和推理引擎)
  • 对底层体系结构和并行计算的要求高,入门门槛不低

缺点 / 挑战

  • 参与业界顶尖大模型的推理落地,技术挑战大,成长空间广阔
  • 工作强度可能较高,需要应对线上稳定性问题和性能瓶颈的快速定位
  • 适合对AI系统优化有强烈热情、具备扎实底层功底、愿意挑战超大规模分布式系统性能极限的工程师

角色解读

  • 技术纵深发展:成为AI推理优化专家,在算子、框架、硬件适配等方向持续深耕
  • 架构师方向:从单一模块扩展到整个推理系统架构设计,主导大规模分布式服务优化
  • 技术管理方向:在团队中积累项目经验后,可转向技术Leader,带领小组攻克难题
  • 负责豆包自研大模型在超大规模AI加速卡集群上的部署、适配和性能调优,确保线上服务稳定高效
  • 优化分布式推理框架的核心模块,包括调度、显存管理、KV Cache、分布式并行等,提升吞吐和降低延迟
  • 面向不同AI芯片(如GPU、昇腾等)开发高性能算子,包括Attention、GEMM、量化等,并优化通信与计算融合
  • 扎实的C/C++或Python编程能力,以及Linux环境下的工程习惯
  • 深入理解计算机体系结构、高性能计算或分布式系统中的一个方向
  • 了解大模型推理流程,对Serving框架、调度、并发、显存管理等有浓厚兴趣

申请策略

  • 在面试中展示对性能指标的敏感度(延迟、吞吐、显存),并准备一个完整的优化案例
  • 了解字节跳动Seed团队的业务方向(豆包、火山引擎),思考自身经验如何与业务结合
  • 突出高性能计算、分布式系统或AI芯片优化相关的项目经验,最好有量化成果(如延迟降低、吞吐提升)
  • 强调编程语言(C/C++/Python)的熟练度,以及Linux系统调优经验
  • 如有参加过OI/ACM、HPC竞赛或开源贡献,务必展示以体现工程能力
  • 提前熟悉主流推理框架如vLLM、SGLang的源码和原理,尝试运行和调优
  • 学习CUDA编程或特定AI芯片(如昇腾、寒武纪)的开发工具链,动手写简单算子

面试指南

  • 对于系统设计类问题,可先概述目标,再拆解关键指标(吞吐、延迟、显存),给出权衡方案
  • 对于优化案例,按“问题-分析-方案-结果”结构回答,突出量化对比和原理思考
  • 对于原理性问题,先给出定义,再结合实际场景说明其重要性及常见优化手段
  • 请解释大模型推理中KV Cache的工作原理及优化方法
  • 在设计分布式推理系统时,如何平衡吞吐和延迟?
  • 描述一个你优化过的性能瓶颈案例,使用了哪些方法?
  • CUDA编程中Shared Memory和Global Memory的区别及优化策略
  • 你对vLLM框架中的PagedAttention有何理解?

匹配度报告

72
综合匹配度

顶尖AI推理优化岗,前沿技术栈驱动,高成长性,但工作强度较大且WLB一般。

适合人群
最适合追求技术成长、渴望挑战前沿AI系统优化难题、能接受快节奏高强度工作的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展95
工作生活40
使命价值70

薪资福利匹配

85较高

字节跳动作为头部互联网公司,薪资福利具有较强竞争力,岗位属于核心研发,但JD未披露具体薪资细节,整体补偿性动机满足度较高。

薪资信号未披露(AI估算:30K-60K/月)

成长发展匹配

95较高

该岗位专注于AI推理优化前沿技术,涉及大模型、异构硬件、高性能计算等,团队实力强,成长空间巨大,发展性动机得到极大满足。

技术前沿前沿/新兴技术
技术栈LLM推理、分布式系统、高性能计算、CUDA、异构硬件、KV Cache、vLLM
业务类型profit_center

工作生活匹配

40较低

字节跳动整体工作强度较高,JD未提及弹性工作或远程选项,且上海办公室通常为现场办公,生活化动机满足度较低。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

70中等

参与通用大模型研发和落地,对AI技术进步有直接贡献,社会影响力正面,但岗位偏技术实现,使命感相对中等。

行业发展高速增长赛道
社会影响正向社会影响力较高
使命信号致力于寻找通用智能的新方法,追求智能上限,为科技和社会发展作出贡献
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 商家BD-抖音生活服务

    字节跳动 · 成都市
    AI 估算 · 10k-20k
  • 商家BD-抖音生活服务

    字节跳动 · 三亚市
    AI 估算 · 8k-20k
  • 商家BD-抖音生活服务

    字节跳动 · 东莞市
    AI 估算 · 8k-15k
  • 算法工程师-地理位置中台(北京/上海/深圳)

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • AI素材创意策划-ONE Studio

    字节跳动 · 北京市
    AI 估算 · 20k-35k

相似职位推荐

  • AI大模型算法实习生-2027届

    小米 · 北京市
    AI 估算 · 5k-8k
  • 商业算法实习生—base上海通用岗

    小红书 · 上海市
    AI 估算 · 4k-10k
  • 企业微信-评测算法工程师-(北京/成都)

    腾讯 · 北京市
    AI 估算 · 25k-45k
  • Diagnostic Architecture

    大众汽车 · 合肥市
    AI 估算 · 15k-25k
  • R&DWhere your curiosity drives the miracles of science

    赛诺菲 · 苏州市
    AI 估算 · 35k-50k

字节跳动 的其他在招职位

  • 商家BD-抖音生活服务

    字节跳动 · 成都市
    AI 估算 · 10k-20k
  • 商家BD-抖音生活服务

    字节跳动 · 三亚市
    AI 估算 · 8k-20k
  • 商家BD-抖音生活服务

    字节跳动 · 东莞市
    AI 估算 · 8k-15k
  • 算法工程师-地理位置中台(北京/上海/深圳)

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • AI素材创意策划-ONE Studio

    字节跳动 · 北京市
    AI 估算 · 20k-35k

相似职位推荐

  • AI大模型算法实习生-2027届

    小米 · 北京市
    AI 估算 · 5k-8k
  • 商业算法实习生—base上海通用岗

    小红书 · 上海市
    AI 估算 · 4k-10k
  • 企业微信-评测算法工程师-(北京/成都)

    腾讯 · 北京市
    AI 估算 · 25k-45k
  • Diagnostic Architecture

    大众汽车 · 合肥市
    AI 估算 · 15k-25k
  • R&DWhere your curiosity drives the miracles of science

    赛诺菲 · 苏州市
    AI 估算 · 35k-50k