字节跳动的大模型推理调度编排专家-Seed薪资是多少？

该职位薪资范围为 40k–70k（人民币/月）。

大模型推理调度编排专家-Seed的工作地点在哪里？

该职位工作地点位于北京市。工作形式为仅现场办公。

字节跳动的大模型推理调度编排专家-Seed有什么任职要求？

该职位要求学历未注明学历及高级经验工作经验。

字节跳动

大模型推理调度编排专家-Seed

立即应聘

大模型推理调度编排专家-Seed

发布于大约 2 个月前

普通员工/个人贡献者

北京市

高级经验

全职员工

仅现场办公

学历未注明

软件工程

分布式系统

GPU

RDMA

大模型推理

AI 估算 · 40k–70k

字节跳动专家岗，AI核心方向，技能稀缺，薪资竞争力强。

职位详情

关于这个职位

作为字节跳动Seed团队的大模型推理调度编排专家，你将负责海量异构GPU资源的调度与编排，优化大模型推理服务的性能和稳定性

你将与顶尖AI团队合作，参与设计大规模分布式系统的调度策略，推动前沿技术落地，支持豆包、即梦等超过50个应用场景

适合对分布式系统、Kubernetes和大模型推理有深入理解的技术专家

最低要求

熟练掌握Linux环境下的C++/Go/Python/Shell等1至2种以上语言

熟悉Kubernetes架构和生态，熟悉Docker/Containerd/Kata/Podman等容器技术，有丰富的机器学习系统实践和开发经验

掌握分布式系统原理，参与过分布式系统的设计、开发和维护

有优秀的逻辑分析能力，能够对业务逻辑进行合理的抽象和拆分

有强烈的工作责任心，较好的学习能力、沟通能力和自驱力，能够快速的响应和行动

有良好的工作文档习惯，及时按要求撰写更新工作流程及技术文档

工作职责

负责海量大模型异构资源的调度编排、算力池化、弹性资源混布、潮汐资源拆借和Quota管理

负责大模型推理服务的多角色、多阶段、PD分图/EP调度，KV Cache centric调度，实现动态、及时、准确的扩缩容管理

负责通过技术手段实现计算资源、RDMA高速网络资源、缓存/存储资源的最优编排，充分发挥大规模分布式集群算力

负责大模型服务的稳定性，通过线上和线下的多系统联动，实现在多种异构资源（GPU、CPU、其他异构硬件）、多云环境、多种网络流量场景的问题定位、诊断、隔离和快速恢复

负责多机房、多地域、多云场景的在离线任务/服务调度，实现负载的合理化分布

优先资格

熟悉至少一种主流的机器学习框架/推理引擎（例如vLLM/SGLang/PyTorch）

有大模型资源调度/服务编排的落地经验

熟悉了解GPU系统/体系结构

在计算机系统顶会（包括但不限于OSDI/NSDI/SOSP/FAST/Eurosys）上有文章发表经验

AI 洞察

优缺点分析

优点

字节跳动平台资源丰富，有机会接触到超大规模分布式系统和高性能计算
团队学术氛围浓厚，有发顶会的机会，与顶尖工程师合作
涉及多系统联动和异构资源，问题排查复杂，需要深厚的技术功底
大模型业务迭代快，需要快速响应和持续优化，工作节奏可能较快
适合对分布式系统和AI基础设施有浓厚兴趣，喜欢解决高难度技术问题，具备较强自驱力和学习能力的资深工程师

缺点 / 挑战

处于AI和大模型的最前沿技术栈，技术挑战高，成长空间大
对分布式系统、K8s和GPU的理解要求极高，入门门槛较高

角色解读

横向扩展：深入理解AI基础设施全栈，成为系统架构专家
纵向升级：在大模型调度领域深耕，参与顶会论文发表，引领行业技术标准
管理路线：带领团队负责核心调度系统的演进，培养新晋工程师
设计和实现大规模GPU集群的资源调度与编排系统，优化算力利用率和任务分配
开发大模型推理服务的动态调度策略，包括PD分离、KV Cache感知调度和自动扩缩容
协同网络和存储团队，优化RDMA和分布式缓存性能，保障服务稳定性和低延迟
精通Kubernetes/Docker等容器编排技术，并能进行二次开发
熟练掌握C++/Go/Python，具备分布式系统开发经验
了解GPU体系结构和机器学习推理框架（如vLLM、SGLang）

申请策略

关注字节跳动Seed团队的技术博客和开源项目，了解其技术栈和方向
准备时重点思考大规模调度中的挑战（如资源碎片、优先级抢占、故障恢复）的解决方案
突出在Kubernetes和容器化方面的项目经验，尤其是大规模集群调度或资源管理
展示参与分布式系统设计、性能优化或稳定性保障的具体案例和量化成果
如有大模型推理部署或GPU资源调优经验，务必详细描述
深入掌握Kubernetes源码和调度器扩展机制
学习主流推理引擎（vLLM/SGLang）的架构和优化技巧
补充GPU体系结构和CUDA编程知识

面试指南

对于设计类问题，采用分层架构思路，先抽象核心组件（资源管理、调度策略、监控反馈），再细化实现
对于稳定性问题，从监控、告警、自动恢复、容灾演练等维度展开，结合具体场景
技术原理类问题，清晰描述概念，结合自己的实践经验讲解优化思路
如何设计一个支持GPU异构资源的调度器？
Kubernetes调度器的工作原理及如何自定义调度策略？
大模型推理中的PD分离和KV Cache调度是如何实现的？
如何保证大规模集群下推理服务的稳定性？请举例说明
解释RDMA在分布式训练/推理中的作用和面临的挑战

职位点评

综合评分

字节跳动AI团队，前沿技术栈，高成长性，薪资优厚，但WLB一般。

更适合这类人

最看重技术成长和职业发展，愿意在高技术难度和快节奏环境中挑战自我的求职者。

表现最好

成长发展

相对薄弱

工作生活

薪资福利80

成长发展92

工作生活50

使命价值75

薪资福利

80较高

薪资水平在行业中属于偏高，字节跳动福利较好，但未明确提及具体福利，因此评分较高但不满分。

薪资信号未披露（AI估算：40K-70K/月）

成长发展

92较高

职位处于AI前沿领域，技术挑战大，团队有学术氛围和发顶会机会，成长路径清晰，发展性动机满足度高。

技术前沿前沿/新兴技术

技术栈Kubernetes、大模型推理、GPU、RDMA、vLLM、SGLang

成长机会团队研究方向涵盖MLLM、GenMedia、AI for Science等、在计算机系统顶会上有文章发表经验

业务类型profit_center

工作生活

50较低

工作地点明确北京办公室，未提及弹性或远程，互联网公司通常节奏快，WLB信号不明确。

工作模式仅现场办公

办公地点市区核心地段

加班情况未提及（无法判断）

使命价值

75中等

AI大模型是高速增长赛道，对社会有显著影响，但使命性表述相对中性，有贡献科技发展的愿景。

行业发展高速增长赛道

社会影响正向社会影响力较高

使命信号追求智能上限，为科技和社会发展作出贡献

创新程度积极采用新技术

Watch Jobs

字节跳动

大模型推理调度编排专家-Seed

立即应聘

大模型推理调度编排专家-Seed

发布于大约 2 个月前

普通员工/个人贡献者

北京市

高级经验

全职员工

仅现场办公

学历未注明

软件工程

分布式系统

GPU

RDMA

大模型推理

AI 估算 · 40k–70k

字节跳动专家岗，AI核心方向，技能稀缺，薪资竞争力强。

职位详情

关于这个职位

作为字节跳动Seed团队的大模型推理调度编排专家，你将负责海量异构GPU资源的调度与编排，优化大模型推理服务的性能和稳定性

你将与顶尖AI团队合作，参与设计大规模分布式系统的调度策略，推动前沿技术落地，支持豆包、即梦等超过50个应用场景

适合对分布式系统、Kubernetes和大模型推理有深入理解的技术专家

最低要求

熟练掌握Linux环境下的C++/Go/Python/Shell等1至2种以上语言

熟悉Kubernetes架构和生态，熟悉Docker/Containerd/Kata/Podman等容器技术，有丰富的机器学习系统实践和开发经验

掌握分布式系统原理，参与过分布式系统的设计、开发和维护

有优秀的逻辑分析能力，能够对业务逻辑进行合理的抽象和拆分

有强烈的工作责任心，较好的学习能力、沟通能力和自驱力，能够快速的响应和行动

有良好的工作文档习惯，及时按要求撰写更新工作流程及技术文档

工作职责

负责海量大模型异构资源的调度编排、算力池化、弹性资源混布、潮汐资源拆借和Quota管理

负责大模型推理服务的多角色、多阶段、PD分图/EP调度，KV Cache centric调度，实现动态、及时、准确的扩缩容管理

负责通过技术手段实现计算资源、RDMA高速网络资源、缓存/存储资源的最优编排，充分发挥大规模分布式集群算力

负责多机房、多地域、多云场景的在离线任务/服务调度，实现负载的合理化分布

优先资格

熟悉至少一种主流的机器学习框架/推理引擎（例如vLLM/SGLang/PyTorch）

有大模型资源调度/服务编排的落地经验

熟悉了解GPU系统/体系结构

在计算机系统顶会（包括但不限于OSDI/NSDI/SOSP/FAST/Eurosys）上有文章发表经验

AI 洞察

优缺点分析

优点

字节跳动平台资源丰富，有机会接触到超大规模分布式系统和高性能计算
团队学术氛围浓厚，有发顶会的机会，与顶尖工程师合作
涉及多系统联动和异构资源，问题排查复杂，需要深厚的技术功底
大模型业务迭代快，需要快速响应和持续优化，工作节奏可能较快
适合对分布式系统和AI基础设施有浓厚兴趣，喜欢解决高难度技术问题，具备较强自驱力和学习能力的资深工程师

缺点 / 挑战

处于AI和大模型的最前沿技术栈，技术挑战高，成长空间大
对分布式系统、K8s和GPU的理解要求极高，入门门槛较高

角色解读

横向扩展：深入理解AI基础设施全栈，成为系统架构专家
纵向升级：在大模型调度领域深耕，参与顶会论文发表，引领行业技术标准
管理路线：带领团队负责核心调度系统的演进，培养新晋工程师
设计和实现大规模GPU集群的资源调度与编排系统，优化算力利用率和任务分配
开发大模型推理服务的动态调度策略，包括PD分离、KV Cache感知调度和自动扩缩容
协同网络和存储团队，优化RDMA和分布式缓存性能，保障服务稳定性和低延迟
精通Kubernetes/Docker等容器编排技术，并能进行二次开发
熟练掌握C++/Go/Python，具备分布式系统开发经验
了解GPU体系结构和机器学习推理框架（如vLLM、SGLang）

申请策略

关注字节跳动Seed团队的技术博客和开源项目，了解其技术栈和方向
准备时重点思考大规模调度中的挑战（如资源碎片、优先级抢占、故障恢复）的解决方案
突出在Kubernetes和容器化方面的项目经验，尤其是大规模集群调度或资源管理
展示参与分布式系统设计、性能优化或稳定性保障的具体案例和量化成果
如有大模型推理部署或GPU资源调优经验，务必详细描述
深入掌握Kubernetes源码和调度器扩展机制
学习主流推理引擎（vLLM/SGLang）的架构和优化技巧
补充GPU体系结构和CUDA编程知识

面试指南

对于设计类问题，采用分层架构思路，先抽象核心组件（资源管理、调度策略、监控反馈），再细化实现
对于稳定性问题，从监控、告警、自动恢复、容灾演练等维度展开，结合具体场景
技术原理类问题，清晰描述概念，结合自己的实践经验讲解优化思路
如何设计一个支持GPU异构资源的调度器？
Kubernetes调度器的工作原理及如何自定义调度策略？
大模型推理中的PD分离和KV Cache调度是如何实现的？
如何保证大规模集群下推理服务的稳定性？请举例说明
解释RDMA在分布式训练/推理中的作用和面临的挑战

职位点评

综合评分

字节跳动AI团队，前沿技术栈，高成长性，薪资优厚，但WLB一般。

更适合这类人

最看重技术成长和职业发展，愿意在高技术难度和快节奏环境中挑战自我的求职者。

表现最好

成长发展

相对薄弱

工作生活

薪资福利80

成长发展92

工作生活50

使命价值75

薪资福利

80较高

薪资水平在行业中属于偏高，字节跳动福利较好，但未明确提及具体福利，因此评分较高但不满分。

薪资信号未披露（AI估算：40K-70K/月）

成长发展

92较高

职位处于AI前沿领域，技术挑战大，团队有学术氛围和发顶会机会，成长路径清晰，发展性动机满足度高。

技术前沿前沿/新兴技术

技术栈Kubernetes、大模型推理、GPU、RDMA、vLLM、SGLang

成长机会团队研究方向涵盖MLLM、GenMedia、AI for Science等、在计算机系统顶会上有文章发表经验

业务类型profit_center

工作生活

50较低

工作地点明确北京办公室，未提及弹性或远程，互联网公司通常节奏快，WLB信号不明确。

工作模式仅现场办公

办公地点市区核心地段

加班情况未提及（无法判断）

使命价值

75中等

AI大模型是高速增长赛道，对社会有显著影响，但使命性表述相对中性，有贡献科技发展的愿景。

行业发展高速增长赛道

社会影响正向社会影响力较高

使命信号追求智能上限，为科技和社会发展作出贡献

创新程度积极采用新技术

Watch Jobs

大模型推理调度编排专家-Seed

职位详情

关于这个职位

最低要求

工作职责

优先资格

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

大模型推理调度编排专家-Seed

职位详情

关于这个职位

最低要求

工作职责

优先资格

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

字节跳动 的其他在招职位

短剧安全应急处置负责人-CQC

服饰KA商业化（男装）-抖音电商

成长型客户销售经理（AI&企业服务）-火山引擎

策略运营（主播运营方向）-TikTok直播

高级前端开发工程师（直播活动研发方向）-TikTok直播

相似职位推荐

Agent 平台架构师

AI应用开发工程师-汽车专项-实习

混元AI Agent Harness Engineer（北京/深圳））

AI应用工程师

Java开发工程师

字节跳动 的其他在招职位

短剧安全应急处置负责人-CQC

服饰KA商业化（男装）-抖音电商

成长型客户销售经理（AI&企业服务）-火山引擎

策略运营（主播运营方向）-TikTok直播

高级前端开发工程师（直播活动研发方向）-TikTok直播

相似职位推荐

Agent 平台架构师

AI应用开发工程师-汽车专项-实习

混元AI Agent Harness Engineer（北京/深圳））

AI应用工程师

Java开发工程师

字节跳动的其他在招职位

字节跳动的其他在招职位