Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
大模型推理调度编排专家-Seed
立即应聘

大模型推理调度编排专家-Seed

发布于 大约 16 小时前

普通员工/个人贡献者

上海市
专家级经验
全职员工
仅现场办公
学历未注明
分布式系统
GPU
GO
RDMA
容器技术
资源调度
大模型推理

AI 估算 · 50k–80k

大模型推理调度专家稀缺,字节跳动薪资竞争力强,技术难度高,综合预估月薪50-80K,16薪。

职位详情

关于这个职位

该岗位负责字节跳动大规模大模型推理服务的资源调度与编排,包括异构资源管理、弹性扩缩容、稳定性保障等

你将使用Kubernetes、容器化技术和分布式系统原理,优化GPU、RDMA等资源利用率,支撑豆包等核心产品的AI能力
适合有大模型系统落地经验的资深工程师

最低要求

熟练掌握Linux环境下的C++/Go/Python/Shell等1至2种以上语言

熟悉Kubernetes架构和生态,熟悉Docker/Containerd/Kata/Podman等容器技术,有丰富的机器学习系统实践和开发经验
掌握分布式系统原理,参与过分布式系统的设计、开发和维护
有优秀的逻辑分析能力,能够对业务逻辑进行合理的抽象和拆分
有强烈的工作责任心,较好的学习能力、沟通能力和自驱力,能够快速的响应和行动
有良好的工作文档习惯,及时按要求撰写更新工作流程及技术文档

工作职责

负责海量大模型异构资源的调度编排、算力池化、弹性资源混布、潮汐资源拆借和Quota管理

负责大模型推理服务的多角色、多阶段、PD分图/EP调度,KV Cache centric调度,实现动态、及时、准确的扩缩容管理
负责通过技术手段实现计算资源、RDMA高速网络资源、缓存/存储资源的最优编排,充分发挥大规模分布式集群算力
负责大模型服务的稳定性,通过线上和线下的多系统联动,实现在多种异构资源、多云环境、多种网络流量场景的问题定位、诊断、隔离和快速恢复
负责多机房、多地域、多云场景的在离线任务/服务调度,实现负载的合理化分布

优先资格

熟悉至少一种主流的机器学习框架/推理引擎(例如vLLM/SGLang/PyTorch)

有大模型资源调度/服务编排的落地经验
熟悉了解GPU系统/体系结构
在计算机系统顶会(包括但不限于OSDI/NSDI/SOSP/FAST/Eurosys)上有文章发表经验

AI 洞察

优缺点分析

优点

  • 参与前沿大模型基础设施研发,掌握稀缺的AI系统技能
  • 团队学术氛围浓厚,有顶会发表机会,可与世界级专家共事
  • 技术难度高,需同时掌握调度系统、容器化、GPU等多种技术栈
  • 互联网大厂工作强度大,可能涉及on-call值班和应急响应
  • 竞争激烈,需要持续学习跟进最新技术趋势

缺点 / 挑战

  • 字节跳动平台大,业务场景丰富(豆包、火山引擎等),技术挑战高
  • 适合有分布式系统或Kubernetes背景,渴望在AI基础设施领域深耕,能接受高强度技术挑战的资深工程师

角色解读

  • 技术深度:从资源调度专家成长为分布式系统架构师,或深入AI基础设施领域
  • 管理方向:可晋升为技术Leader,带领团队攻克更大规模的调度挑战
  • 行业前景:大模型时代,AI基础设施人才极度稀缺,职业天花板高
  • 设计并实现大模型推理服务的资源调度与编排系统,包括异构GPU/CPU资源的池化、弹性伸缩和潮汐调度
  • 优化KV Cache管理、PD分图/EP调度等策略,提升推理吞吐和延迟表现
  • 保障大规模集群的稳定性,处理多机房、多云环境下的故障诊断与快速恢复
  • 与算法、平台团队协作,推动资源利用率和部署效率的持续改进
  • 精通C++/Go/Python等语言,具备扎实的系统编程能力
  • 深入理解Kubernetes架构及容器技术(Docker/Containerd),有生产环境调度经验
  • 熟悉分布式系统原理,能设计高可用、高并发的调度系统
  • 了解GPU体系结构、RDMA网络及大模型推理引擎(vLLM/SGLang)者优先

申请策略

  • 了解字节跳动Seed团队的技术博客和开源项目,面试中展示对团队工作的关注
  • 准备一两个自己主导的复杂系统案例,详细阐述设计思路和挑战
  • 突出在大模型推理、资源调度或Kubernetes方面的实际项目经验,特别是规模化的生产环境
  • 强调分布式系统设计能力,如高可用、弹性伸缩、故障恢复等
  • 如有开源贡献或顶会论文,务必列出
  • 展示对GPU、RDMA等硬件资源调度的理解
  • 深入学习Kuberentes调度器扩展和自定义控制器开发
  • 动手实践vLLM、SGLang等推理引擎的部署与调优

面试指南

  • 结构化回答:先明确问题范围,再给出设计方案,包括架构、关键组件、权衡点
  • STAR法则:对于经历类问题,按情境(Situation)、任务(Task)、行动(Action)、结果(Result)组织
  • 结合字节业务:提到豆包、火山引擎等场景,展示对业务的理解
  • 如何设计一个支持弹性扩缩容的大模型推理服务调度系统?
  • Kubernetes中如何优化GPU资源的分配与回收?
  • 请解释PD分图调度和KV Cache centric调度的原理与挑战
  • 在多机房场景下,如何保证任务调度的低延迟和高可用?
  • 描述一次你排查和解决大规模分布式系统故障的经历

匹配度报告

76
综合匹配度

大厂AI核心岗位,前沿技术栈,高薪资高成长,但WLB一般。

适合人群
最适合追求技术成长和职业发展、能承受高强度工作的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展95
工作生活40
使命价值85

薪资福利匹配

85较高

字节跳动薪资竞争力强,尤其是AI专家岗位,但JD未明确薪资福利细节,综合评估补偿性动机满足程度较高。

薪资信号未披露(AI估算:50K-80K/月)

成长发展匹配

95较高

该职位涉及大模型前沿技术,团队有顶会发表机会,成长空间大,发展性动机得到极好满足。

技术前沿前沿/新兴技术
技术栈大模型、推理调度、Kubernetes、GPU、RDMA、vLLM、SGLang、分布式系统
业务类型ambiguous

工作生活匹配

40较低

职位要求快速响应和行动,且互联网大厂工作强度普遍较高,JD未提及WLB信号,生活化动机满足有限。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

85较高

参与通用智能方法探索,团队愿景宏大,产品用户量领先,社会影响力较高,意义感动机满足好。

行业发展高速增长赛道
社会影响正向社会影响力较高
使命信号致力于寻找通用智能的新方法,追求智能上限
创新程度开拓性创新(行业首创)
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 商家BD-抖音生活服务(常州)

    字节跳动 · 常州市
    AI 估算 · 8k-15k
  • 市场营销经理(汽车及泛高科技行业)-飞书

    字节跳动 · 上海市
    AI 估算 · 25k-40k
  • 巨量千川自助客户增长运营-抖音电商

    字节跳动 · 上海市
    AI 估算 · 25k-45k
  • 大客户销售(零售行业)-抖音生活服务(成都)

    字节跳动 · 成都市
    AI 估算 · 20k-40k
  • 高级C++开发工程师 - 飞书视频会议

    字节跳动 · 杭州市
    AI 估算 · 30k-50k

相似职位推荐

  • 广告算法工程师-【海外算法中心】

    快手 · 北京市
    AI 估算 · 30k-60k
  • 高级数据研发工程师-【可灵AI专项】

    快手 · 北京市
    AI 估算 · 30k-50k
  • Java技术专家(架构)-【商业化】

    快手 · 北京市
    AI 估算 · 50k-80k

字节跳动 的其他在招职位

  • 商家BD-抖音生活服务(常州)

    字节跳动 · 常州市
    AI 估算 · 8k-15k
  • 市场营销经理(汽车及泛高科技行业)-飞书

    字节跳动 · 上海市
    AI 估算 · 25k-40k
  • 巨量千川自助客户增长运营-抖音电商

    字节跳动 · 上海市
    AI 估算 · 25k-45k
  • 大客户销售(零售行业)-抖音生活服务(成都)

    字节跳动 · 成都市
    AI 估算 · 20k-40k
  • 高级C++开发工程师 - 飞书视频会议

    字节跳动 · 杭州市
    AI 估算 · 30k-50k

相似职位推荐

  • 广告算法工程师-【海外算法中心】

    快手 · 北京市
    AI 估算 · 30k-60k
  • 高级数据研发工程师-【可灵AI专项】

    快手 · 北京市
    AI 估算 · 30k-50k
  • Java技术专家(架构)-【商业化】

    快手 · 北京市
    AI 估算 · 50k-80k