Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
AI异构硬件推理优化专家-Seed
立即应聘

AI异构硬件推理优化专家-Seed

发布于 大约 7 小时前

普通员工/个人贡献者

北京市
中级经验
全职员工
仅现场办公
学历未注明
软件工程
分布式系统
高性能计算
CUDA
LLM推理优化
并行计算
SGLang
vLLM

AI 估算 · 35k–65k

AI大模型推理优化岗位,技术门槛高,需求旺盛,薪资处于行业领先水平,结合大厂薪资结构估算。

职位详情

关于这个职位

该职位主要负责字节跳动Seed团队自研LLM模型的推理业务落地,涉及分布式推理框架优化、高性能算子开发与在线稳定性建设

你将参与超大规模AI加速卡集群的部署与性能调优,支撑豆包和火山引擎的大规模在线业务
这是一个技术深度高、挑战性强的前沿岗位,适合对AI推理优化有热情、具备扎实系统能力的工程师

最低要求

计算机、软件工程、人工智能、电子信息、微电子等相关专业优先

熟悉Linux环境下的C/C++或Python,具备扎实的编程能力和工程习惯
熟悉计算机体系结构、芯片微架构、高性能计算、分布式系统、并行计算中的至少一个方向
了解大模型推理基本流程,对Serving、调度、并发、显存管理、KV Cache或分布式推理有兴趣
关注延迟、吞吐、带宽、算力利用率、显存占用、网络通信和在线稳定性等性能问题

工作职责

业务Serving上线:参与豆包Seed自研LLM模型在超大规模AI加速卡集群上的部署、适配、性能调优和稳定性建设

推理框架优化:优化调度、Batching、KV Cache、显存管理、分布式并行、负载均衡、投机推理、稀疏计算和量化等核心链路
高性能算子与通信优化:面向不同异构硬件ISA开发和优化Attention、GEMM、量化、通算融合等关键LLM算子

优先资格

有AI芯片性能优化经验,热衷于探索不同芯片或集群的性能边界

熟悉常见的推理Serving技术栈,包括vLLM、SGLang、PagedAttention、投机推理等
有CUDA、AscendC、TileLang、Triton、CUTLASS、TVM、MLIR、TorchInductor等相关经验
具备以下经验:高性能算子开发、网络通信优化、推理引擎优化、在线服务性能优化或硬件适配
有OI/ACM、HPC竞赛、系统竞赛、科研项目或开源项目经历

AI 洞察

优缺点分析

优点

  • 技术前沿性:直接参与全球领先的LLM推理优化,接触最新的大模型技术和异构硬件
  • 平台优势:字节跳动拥有海量业务流量和丰富资源,工作成果可快速落地并产生巨大影响
  • 技能积累:涵盖高性能计算、分布式系统、芯片优化等多个高价值领域,职业竞争力强
  • 技术难度高:需要同时掌握底层体系结构、AI框架和业务部署等多层次知识,学习曲线陡峭
  • 竞争激烈:团队内部和行业人才密度高,持续学习和创新是常态

缺点 / 挑战

  • 工作强度大:承担在线业务稳定性责任,可能出现紧急响应和较高强度的工作节奏
  • 这个职位适合对AI推理优化充满热情、具备扎实的系统编程和计算机体系结构基础、愿意挑战高难度技术问题并追求极致性能的工程师

角色解读

  • 技术专家路线:在推理优化、高性能计算领域深耕,成为AI基础设施的权威专家
  • 架构师路线:参与大规模分布式系统的设计与演进,主导推理框架的架构升级
  • 跨界发展:积累异构硬件适配经验,可向芯片设计、编译器或系统软件等方向拓展
  • 负责豆包Seed自研LLM模型在超大规模AI加速卡集群上的部署、适配和性能调优,确保在线业务稳定运行
  • 优化分布式推理框架的核心链路,包括调度、Batching、KV Cache、显存管理和分布式并行等
  • 针对不同异构硬件ISA开发高性能算子(如Attention、GEMM),并优化通信与计算融合
  • 扎实的C/C++和Python编程能力,熟悉Linux开发环境
  • 深入理解计算机体系结构、芯片微架构或高性能计算等至少一个方向
  • 熟悉大模型推理流程及Serving技术栈,对性能调优有浓厚兴趣

申请策略

  • 在简历或面试中强调对AI推理性能优化的独到见解,例如如何权衡延迟和吞吐
  • 了解字节跳动Seed团队的技术方向(如MLLM、GenMedia),在面试中展示对业务场景的理解
  • 重点突出高性能计算、分布式系统或AI推理相关的项目经验,特别是LLM Serving优化或算子开发
  • 展示对性能指标的敏感度,如延迟、吞吐、显存优化等,最好有量化的成果数据
  • 如果有CUDA、Triton、vLLM等具体工具的使用经验,务必详细说明
  • 竞赛或开源贡献经历(如OI/ACM、HPC竞赛)是加分项,应单独列出
  • 深入研究vLLM或SGLang的源码,理解PagedAttention、调度、显存管理等核心机制
  • 学习CUDA或Triton编程,尝试开发简单的算子并对比优化效果

面试指南

  • 针对性能优化问题,采用「现状分析→瓶颈定位→优化方案→效果验证」的结构化思路
  • 对于设计类问题,先明确约束条件(硬件、延迟要求等),再给出架构选择,并解释权衡
  • 考察开源框架理解时,结合源码细节和实际调优经验,体现深入思考
  • 请详细讲解LLM推理中KV Cache的作用及优化策略
  • 如何优化一个GEMM算子在特定硬件上的性能?请从计算、访存和通信角度分析
  • 设计一个分布式推理Serving系统,如何处理负载均衡和显存管理?
  • 你用过哪些推理框架?比较vLLM、SGLang和TGI的优缺点
  • 如何调试和定位在线推理服务中的性能瓶颈?

匹配度报告

68
综合匹配度

前沿AI推理优化岗位,技术栈新颖,薪资竞争力强,但工作节奏较快且WLB一般。

适合人群
该职位最适合以技术成长和行业影响力为核心动机的求职者,能够接受高强度工作以换取快速技能提升。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利70
成长发展90
工作生活30
使命价值80

薪资福利匹配

70中等

薪资水平在行业内具有竞争力,但JD未明确具体数字和福利,部分依赖市场预期。

薪资信号未披露(AI估算:35K-65K/月)

成长发展匹配

90较高

岗位处于AI核心技术领域,涉及最新异构硬件和推理优化,技能成长空间极大,且团队影响力广泛。

技术前沿前沿/新兴技术
技术栈LLM、推理优化、分布式系统、CUDA、vLLM、SGLang、异构硬件
业务类型profit_center

工作生活匹配

30较低

仅现场办公,北京核心地段,JD未提及弹性工作或WLB措施,结合互联网大厂氛围,预计工作强度较高。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

80较高

参与通用智能的研发,对科技进步和社会有显著意义,团队愿景明确,行业前景看好。

行业发展高速增长赛道
社会影响正向社会影响力较高
使命信号致力于寻找通用智能的新方法、为科技和社会发展作出贡献
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 商家素材策略运营(自助中心)-抖音电商

    字节跳动 · 北京市
    AI 估算 · 15k-25k
  • 女装行业运营-抖音电商(苏皖)

    字节跳动 · 上海市
    AI 估算 · 12k-20k
  • 广告算法工程师-抖音电商

    字节跳动 · 上海市
    AI 估算 · 25k-45k
  • 后端开发工程师(AI Agent)-国际化广告质量效能(北京/上海)

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 品牌营销专家(活动方向)-飞书

    字节跳动 · 上海市
    AI 估算 · 20k-35k

相似职位推荐

  • 上海-高级/资深JAVA工程师(商家)

    希音 · 上海市
    AI 估算 · 30k-50k
  • agent开发工程师

    中国平安 · 上海市
    AI 估算 · 25k-45k
  • Display Customer Engineer

    高通 · 北京市
    AI 估算 · 25k-40k
  • Intern_Automotive Cockpit Edge AI

    奔驰 · 上海市
    AI 估算 · 4k-6k
  • 后端开发工程师

    京东 · 上海市
    AI 估算 · 25k-45k

字节跳动 的其他在招职位

  • 商家素材策略运营(自助中心)-抖音电商

    字节跳动 · 北京市
    AI 估算 · 15k-25k
  • 女装行业运营-抖音电商(苏皖)

    字节跳动 · 上海市
    AI 估算 · 12k-20k
  • 广告算法工程师-抖音电商

    字节跳动 · 上海市
    AI 估算 · 25k-45k
  • 后端开发工程师(AI Agent)-国际化广告质量效能(北京/上海)

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 品牌营销专家(活动方向)-飞书

    字节跳动 · 上海市
    AI 估算 · 20k-35k

相似职位推荐

  • 上海-高级/资深JAVA工程师(商家)

    希音 · 上海市
    AI 估算 · 30k-50k
  • agent开发工程师

    中国平安 · 上海市
    AI 估算 · 25k-45k
  • Display Customer Engineer

    高通 · 北京市
    AI 估算 · 25k-40k
  • Intern_Automotive Cockpit Edge AI

    奔驰 · 上海市
    AI 估算 · 4k-6k
  • 后端开发工程师

    京东 · 上海市
    AI 估算 · 25k-45k