Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
大模型推理调度编排专家-Seed
立即应聘

大模型推理调度编排专家-Seed

发布于 大约 9 小时前

普通员工/个人贡献者

北京市
高级经验
全职员工
仅现场办公
学历未注明
分布式系统
GPU
GO
RDMA
大模型推理

AI 估算 · 40k–70k

字节跳动专家岗,AI核心方向,技能稀缺,薪资竞争力强。

职位详情

关于这个职位

作为字节跳动Seed团队的大模型推理调度编排专家,你将负责海量异构GPU资源的调度与编排,优化大模型推理服务的性能和稳定性

你将与顶尖AI团队合作,参与设计大规模分布式系统的调度策略,推动前沿技术落地,支持豆包、即梦等超过50个应用场景
适合对分布式系统、Kubernetes和大模型推理有深入理解的技术专家

最低要求

熟练掌握Linux环境下的C++/Go/Python/Shell等1至2种以上语言

熟悉Kubernetes架构和生态,熟悉Docker/Containerd/Kata/Podman等容器技术,有丰富的机器学习系统实践和开发经验
掌握分布式系统原理,参与过分布式系统的设计、开发和维护
有优秀的逻辑分析能力,能够对业务逻辑进行合理的抽象和拆分
有强烈的工作责任心,较好的学习能力、沟通能力和自驱力,能够快速的响应和行动
有良好的工作文档习惯,及时按要求撰写更新工作流程及技术文档

工作职责

负责海量大模型异构资源的调度编排、算力池化、弹性资源混布、潮汐资源拆借和Quota管理

负责大模型推理服务的多角色、多阶段、PD分图/EP调度,KV Cache centric调度,实现动态、及时、准确的扩缩容管理
负责通过技术手段实现计算资源、RDMA高速网络资源、缓存/存储资源的最优编排,充分发挥大规模分布式集群算力
负责大模型服务的稳定性,通过线上和线下的多系统联动,实现在多种异构资源(GPU、CPU、其他异构硬件)、多云环境、多种网络流量场景的问题定位、诊断、隔离和快速恢复
负责多机房、多地域、多云场景的在离线任务/服务调度,实现负载的合理化分布

优先资格

熟悉至少一种主流的机器学习框架/推理引擎(例如vLLM/SGLang/PyTorch)

有大模型资源调度/服务编排的落地经验
熟悉了解GPU系统/体系结构
在计算机系统顶会(包括但不限于OSDI/NSDI/SOSP/FAST/Eurosys)上有文章发表经验

AI 洞察

优缺点分析

优点

  • 字节跳动平台资源丰富,有机会接触到超大规模分布式系统和高性能计算
  • 团队学术氛围浓厚,有发顶会的机会,与顶尖工程师合作
  • 涉及多系统联动和异构资源,问题排查复杂,需要深厚的技术功底
  • 大模型业务迭代快,需要快速响应和持续优化,工作节奏可能较快
  • 适合对分布式系统和AI基础设施有浓厚兴趣,喜欢解决高难度技术问题,具备较强自驱力和学习能力的资深工程师

缺点 / 挑战

  • 处于AI和大模型的最前沿技术栈,技术挑战高,成长空间大
  • 对分布式系统、K8s和GPU的理解要求极高,入门门槛较高

角色解读

  • 横向扩展:深入理解AI基础设施全栈,成为系统架构专家
  • 纵向升级:在大模型调度领域深耕,参与顶会论文发表,引领行业技术标准
  • 管理路线:带领团队负责核心调度系统的演进,培养新晋工程师
  • 设计和实现大规模GPU集群的资源调度与编排系统,优化算力利用率和任务分配
  • 开发大模型推理服务的动态调度策略,包括PD分离、KV Cache感知调度和自动扩缩容
  • 协同网络和存储团队,优化RDMA和分布式缓存性能,保障服务稳定性和低延迟
  • 精通Kubernetes/Docker等容器编排技术,并能进行二次开发
  • 熟练掌握C++/Go/Python,具备分布式系统开发经验
  • 了解GPU体系结构和机器学习推理框架(如vLLM、SGLang)

申请策略

  • 关注字节跳动Seed团队的技术博客和开源项目,了解其技术栈和方向
  • 准备时重点思考大规模调度中的挑战(如资源碎片、优先级抢占、故障恢复)的解决方案
  • 突出在Kubernetes和容器化方面的项目经验,尤其是大规模集群调度或资源管理
  • 展示参与分布式系统设计、性能优化或稳定性保障的具体案例和量化成果
  • 如有大模型推理部署或GPU资源调优经验,务必详细描述
  • 深入掌握Kubernetes源码和调度器扩展机制
  • 学习主流推理引擎(vLLM/SGLang)的架构和优化技巧
  • 补充GPU体系结构和CUDA编程知识

面试指南

  • 对于设计类问题,采用分层架构思路,先抽象核心组件(资源管理、调度策略、监控反馈),再细化实现
  • 对于稳定性问题,从监控、告警、自动恢复、容灾演练等维度展开,结合具体场景
  • 技术原理类问题,清晰描述概念,结合自己的实践经验讲解优化思路
  • 如何设计一个支持GPU异构资源的调度器?
  • Kubernetes调度器的工作原理及如何自定义调度策略?
  • 大模型推理中的PD分离和KV Cache调度是如何实现的?
  • 如何保证大规模集群下推理服务的稳定性?请举例说明
  • 解释RDMA在分布式训练/推理中的作用和面临的挑战

匹配度报告

74
综合匹配度

字节跳动AI团队,前沿技术栈,高成长性,薪资优厚,但WLB一般。

适合人群
最看重技术成长和职业发展,愿意在高技术难度和快节奏环境中挑战自我的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利80
成长发展92
工作生活50
使命价值75

薪资福利匹配

80较高

薪资水平在行业中属于偏高,字节跳动福利较好,但未明确提及具体福利,因此评分较高但不满分。

薪资信号未披露(AI估算:40K-70K/月)

成长发展匹配

92较高

职位处于AI前沿领域,技术挑战大,团队有学术氛围和发顶会机会,成长路径清晰,发展性动机满足度高。

技术前沿前沿/新兴技术
技术栈Kubernetes、大模型推理、GPU、RDMA、vLLM、SGLang
成长机会团队研究方向涵盖MLLM、GenMedia、AI for Science等、在计算机系统顶会上有文章发表经验
业务类型profit_center

工作生活匹配

50较低

工作地点明确北京办公室,未提及弹性或远程,互联网公司通常节奏快,WLB信号不明确。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

75中等

AI大模型是高速增长赛道,对社会有显著影响,但使命性表述相对中性,有贡献科技发展的愿景。

行业发展高速增长赛道
社会影响正向社会影响力较高
使命信号追求智能上限,为科技和社会发展作出贡献
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 服务器整机结构工程师-Data

    字节跳动 · 杭州市
    AI 估算 · 25k-45k
  • 内容营销经理(飞书AI/Agent方向)-飞书

    字节跳动 · 上海市
    AI 估算 · 20k-35k
  • 游戏动作设计组长/专家

    字节跳动 · 深圳市
    AI 估算 · 25k-40k
  • 后端研发工程师-客服平台(成都)

    字节跳动 · 成都市
    AI 估算 · 20k-35k
  • 内容分发策略产品-红果短剧

    字节跳动 · 北京市
    AI 估算 · 20k-35k

相似职位推荐

  • 向量数据库高级研发工程师

    快手 · 北京市
    AI 估算 · 35k-65k

字节跳动 的其他在招职位

  • 服务器整机结构工程师-Data

    字节跳动 · 杭州市
    AI 估算 · 25k-45k
  • 内容营销经理(飞书AI/Agent方向)-飞书

    字节跳动 · 上海市
    AI 估算 · 20k-35k
  • 游戏动作设计组长/专家

    字节跳动 · 深圳市
    AI 估算 · 25k-40k
  • 后端研发工程师-客服平台(成都)

    字节跳动 · 成都市
    AI 估算 · 20k-35k
  • 内容分发策略产品-红果短剧

    字节跳动 · 北京市
    AI 估算 · 20k-35k

相似职位推荐

  • 向量数据库高级研发工程师

    快手 · 北京市
    AI 估算 · 35k-65k