字节跳动的大模型推理存储系统专家-Seed薪资是多少？

该职位薪资范围为 40k–60k（人民币/月）。

大模型推理存储系统专家-Seed的工作地点在哪里？

该职位工作地点位于北京市。工作形式为仅现场办公。

字节跳动的大模型推理存储系统专家-Seed有什么任职要求？

该职位要求学历未注明学历及高级经验工作经验。

字节跳动

大模型推理存储系统专家-Seed

立即应聘

大模型推理存储系统专家-Seed

发布于大约 2 个月前

普通员工/个人贡献者

北京市

高级经验

全职员工

仅现场办公

学历未注明

软件工程

分布式系统

RDMA

NVLINK

SGLang

vLLM

Gpu Direct

AI 估算 · 40k–60k

前沿AI基础设施岗位，技能稀缺，大厂核心团队，薪资竞争力强

职位详情

关于这个职位

作为字节跳动Seed团队的大模型推理存储系统专家，你将负责设计和开发多层级存储系统，优化大模型推理中的KV Cache、数据IO和模型加载，提升推理性能

团队致力于通用智能研究，技术栈前沿，涉及Kubernetes、分布式系统、高速网络等，适合有系统存储经验、希望深耕AI基础设施的工程师

最低要求

熟练掌握Linux环境下的C++/Go/Python/Shell等1至2种以上语言

熟悉Kubernetes架构和生态，熟悉PV/CSI等云原生容器存储技术，有丰富的机器学习系统实践和开发经验

掌握分布式系统原理，参与过分布式系统的设计、开发和维护

有优秀的逻辑分析能力，能够对业务逻辑进行合理的抽象和拆分

有强烈的工作责任心，较好的学习能力、沟通能力和自驱力，能够快速的响应和行动

有良好的工作文档习惯，及时按要求撰写更新工作流程及技术文档

工作职责

负责机器学习系统存储相关组件的设计和开发，服务于大模型推理的各业务场景（LLM/S2S/VLM/多模态等），包括模型分发加载、KV Cache存储和优化，数据IO性能优化，提高推理TTFT、TBT等核心性能指标

负责设计和实现面向大模型推理的多层级存储系统，综合利用显存、本地内存、分布式内存/磁盘、远端大容量存储系统（HDFS/对象存储）等多种介质进行数据的存储和迁移管理，实现「近计算缓存+远端大容量存储」的一体化分级系统

负责优化大模型KV Cache命中率，从推理框架，流量调度，多级缓存等多个系统纬度入手定制化优化策略

优化数据的读取性能，充分利用近计算侧的NVLink、RDMA高速网络、GPU Direct技术实现数据的高效传输

优化数据副本的存放策略，实现负载流量和存储数据的合理化分布

负责设计和实现高效、易用的数据访问接口，实现和推理框架、引擎的无缝对接，管理KV Cache的生命周期

负责Kubernetes场景下多级存储系统的接入、管理、运维、监控及多机房、多地域、多云场景的系统搭建和容灾，确保稳定性并优化跨集群的数据摆放

优先资格

熟悉至少一种主流的机器学习框架/推理引擎（例如vLLM/SGLang/PyTorch）

有大模型推理相关的技术落地经验，比如：KV Cache相关优化的实现

熟悉分布式缓存系统（例如Alluxio/JuiceFS/GooseFS/JindoFS）等

熟悉NVLink、RDMA、NCCL、GPU Direct等技术

在计算机系统存储顶会（包括但不限于OSDI/SOSP/FAST）上有文章发表经验

AI 洞察

优缺点分析

优点

平台优势：字节跳动作为大厂，拥有海量算力和业务场景，技术资源丰富，个人影响力放大，成果可落地到豆包、火山引擎等千万级应用
团队实力：Seed团队在AI领域有长期愿景，研究方向涵盖多模态、科学计算等，技术氛围浓厚，内部交流机会多

缺点 / 挑战

技术前沿：直接参与大模型推理存储这一AI基础设施的核心环节，接触最新硬件加速技术和分布式系统挑战，技能积累快、含金量高
技术难度高：系统涉及GPU、存储、网络多层面的协同优化，需要对底层硬件和系统软件有深刻理解，调试调优极具挑战
工作强度大：大模型业务迭代快，推理性能要求极高，可能面临紧迫的交付压力和较大的加班强度
竞争激烈：作为大厂核心团队，内部人才密度高，需要持续学习保持竞争力，对自驱力和抗压能力要求较高
适合有分布式系统或存储背景、对AI基础设施充满热情、喜欢解决性能瓶颈问题、能承受高强度技术攻关的工程师

角色解读

技术纵深：成为AI基础设施领域的存储专家，在大模型推理性能优化方向持续深耕，解决行业级难题
架构视野：设计跨集群、多层级的分级存储系统，积累大规模分布式系统架构经验，向系统架构师发展
团队领导：表现优异者可带领技术小组，负责关键技术方向的攻关，逐步转向技术管理岗位
设计和实现基于Kubernetes的多层级存储系统，管理GPU显存、本地内存、分布式存储和远端对象存储之间的数据流动，优化推理过程中模型参数和KV Cache的加载效率
优化KV Cache命中率和数据传输性能，利用NVLink、RDMA等高速互联技术减少延迟，提升推理引擎的TTFT和TBT等关键指标
开发高效的数据访问接口，与vLLM、SGLang等推理框架集成，管理KV Cache的生命周期，实现存储与计算的紧密协同
负责多机房和跨集群的存储系统部署、监控和容灾，确保稳定性和数据摆放的合理性
熟练掌握C++/Go/Python，具备系统级编程能力，能够编写高性能存储组件
深入理解Kubernetes和云原生存储技术（如PV、CSI），有机器学习系统开发经验
扎实的分布式系统原理，熟悉分布式缓存、文件系统或对象存储，能够设计高可用、高性能的存储架构
了解主流推理引擎（vLLM、SGLang）和GPU通信技术（NVLink、RDMA、NCCL），有KV Cache优化经验者优先

申请策略

提前了解字节跳动Seed团队的技术方向和公开分享（如技术博客、演讲），在面试中展现对团队工作的理解和热情
准备一个与存储或推理性能优化相关的深度技术案例，展示解决问题的能力
突出分布式存储系统设计经验，特别是涉及多级缓存、数据迁移、负载均衡的项目，附上性能提升数据（如延迟降低%、吞吐提升等）
展示Kubernetes和云原生相关实践，包括自定义CSI驱动、存储编排、Operator开发等
强调机器学习系统经验，如模型加载优化、推理引擎集成、KV Cache相关工作，最好有开源贡献或技术博客
如果参与过OSDI/SOSP/FAST等顶会论文发表，务必醒目列出
系统学习NVLink、RDMA、NCCL等高速网络通信技术，通过动手实验或开源项目加深理解
熟悉vLLM或SGLang等推理引擎的源码，特别是内存管理和KV Cache部分

面试指南

在面对系统优化问题时，采用“问题分析-方案设计-实验验证”的框架：先明确瓶颈指标，对比不同方案的trade-off，再通过实验数据证明效果
在架构设计题中，使用“需求分解-分层设计-关键细节”结构：先梳理功能和非功能需求，再划分层次（接入层、缓存层、存储层），最后讨论数据一致性、可靠性等关键点
请描述你设计过的多级缓存系统，如何保证数据一致性和高命中率？
在大模型推理场景下，KV Cache的存储和访问有哪些关键优化点？
Kubernetes中如何实现一个自定义的CSI存储插件？请简述架构和关键设计
解释NVLink和RDMA在GPU间数据传输中的作用，以及在使用中可能遇到的性能瓶颈
如果模型加载成为推理瓶颈，你会从哪些方面进行优化？
复习分布式存储经典论文（如GFS、Bigtable、Alluxio），理解其设计哲学，并能结合实际场景分析

职位点评

综合评分

大厂核心AI团队，前沿技术栈和高薪资，但工作强度大，WLB一般。

更适合这类人

适合追求技术成长、渴望在AI基础设施领域深耕、能接受高强度工作的求职者。

表现最好

成长发展

相对薄弱

工作生活

薪资福利80

成长发展95

工作生活40

使命价值85

薪资福利

80较高

薪资水平在AI大厂中属于偏高区间，但JD未提及具体福利，稳定性与公司平台相关。

薪资信号偏高 (40K-60K/月)

成长发展

95较高

技术栈前沿（大模型、高性能存储、GPU通信），团队重视创新且有顶会发表机会，成长空间大。

技术前沿前沿/新兴技术

技术栈C++、Go、Python、Kubernetes、分布式系统、NVLink、RDMA、NCCL、GPU Direct、vLLM、SGLang、PyTorch

业务类型profit_center

工作生活

40较低

未明确提及WLB，大厂AI团队通常节奏较快，可能需要加班，办公地点为北京核心区但通勤可能受限。

工作模式未明确

办公地点市区核心地段

加班情况未提及（无法判断）

使命价值

85较高

团队致力于通用智能探索，技术影响力大，产品服务亿级用户，社会价值显著。

行业发展高速增长赛道

社会影响正向社会影响力较高

创新程度积极采用新技术

Watch Jobs

字节跳动

大模型推理存储系统专家-Seed

立即应聘

大模型推理存储系统专家-Seed

发布于大约 2 个月前

普通员工/个人贡献者

北京市

高级经验

全职员工

仅现场办公

学历未注明

软件工程

分布式系统

RDMA

NVLINK

SGLang

vLLM

Gpu Direct

AI 估算 · 40k–60k

前沿AI基础设施岗位，技能稀缺，大厂核心团队，薪资竞争力强

职位详情

关于这个职位

团队致力于通用智能研究，技术栈前沿，涉及Kubernetes、分布式系统、高速网络等，适合有系统存储经验、希望深耕AI基础设施的工程师

最低要求

熟练掌握Linux环境下的C++/Go/Python/Shell等1至2种以上语言

熟悉Kubernetes架构和生态，熟悉PV/CSI等云原生容器存储技术，有丰富的机器学习系统实践和开发经验

掌握分布式系统原理，参与过分布式系统的设计、开发和维护

有优秀的逻辑分析能力，能够对业务逻辑进行合理的抽象和拆分

有强烈的工作责任心，较好的学习能力、沟通能力和自驱力，能够快速的响应和行动

有良好的工作文档习惯，及时按要求撰写更新工作流程及技术文档

工作职责

负责优化大模型KV Cache命中率，从推理框架，流量调度，多级缓存等多个系统纬度入手定制化优化策略

优化数据的读取性能，充分利用近计算侧的NVLink、RDMA高速网络、GPU Direct技术实现数据的高效传输

优化数据副本的存放策略，实现负载流量和存储数据的合理化分布

负责设计和实现高效、易用的数据访问接口，实现和推理框架、引擎的无缝对接，管理KV Cache的生命周期

负责Kubernetes场景下多级存储系统的接入、管理、运维、监控及多机房、多地域、多云场景的系统搭建和容灾，确保稳定性并优化跨集群的数据摆放

优先资格

熟悉至少一种主流的机器学习框架/推理引擎（例如vLLM/SGLang/PyTorch）

有大模型推理相关的技术落地经验，比如：KV Cache相关优化的实现

熟悉分布式缓存系统（例如Alluxio/JuiceFS/GooseFS/JindoFS）等

熟悉NVLink、RDMA、NCCL、GPU Direct等技术

在计算机系统存储顶会（包括但不限于OSDI/SOSP/FAST）上有文章发表经验

AI 洞察

优缺点分析

优点

平台优势：字节跳动作为大厂，拥有海量算力和业务场景，技术资源丰富，个人影响力放大，成果可落地到豆包、火山引擎等千万级应用
团队实力：Seed团队在AI领域有长期愿景，研究方向涵盖多模态、科学计算等，技术氛围浓厚，内部交流机会多

缺点 / 挑战

技术前沿：直接参与大模型推理存储这一AI基础设施的核心环节，接触最新硬件加速技术和分布式系统挑战，技能积累快、含金量高
技术难度高：系统涉及GPU、存储、网络多层面的协同优化，需要对底层硬件和系统软件有深刻理解，调试调优极具挑战
工作强度大：大模型业务迭代快，推理性能要求极高，可能面临紧迫的交付压力和较大的加班强度
竞争激烈：作为大厂核心团队，内部人才密度高，需要持续学习保持竞争力，对自驱力和抗压能力要求较高
适合有分布式系统或存储背景、对AI基础设施充满热情、喜欢解决性能瓶颈问题、能承受高强度技术攻关的工程师

角色解读

技术纵深：成为AI基础设施领域的存储专家，在大模型推理性能优化方向持续深耕，解决行业级难题
架构视野：设计跨集群、多层级的分级存储系统，积累大规模分布式系统架构经验，向系统架构师发展
团队领导：表现优异者可带领技术小组，负责关键技术方向的攻关，逐步转向技术管理岗位
设计和实现基于Kubernetes的多层级存储系统，管理GPU显存、本地内存、分布式存储和远端对象存储之间的数据流动，优化推理过程中模型参数和KV Cache的加载效率
优化KV Cache命中率和数据传输性能，利用NVLink、RDMA等高速互联技术减少延迟，提升推理引擎的TTFT和TBT等关键指标
开发高效的数据访问接口，与vLLM、SGLang等推理框架集成，管理KV Cache的生命周期，实现存储与计算的紧密协同
负责多机房和跨集群的存储系统部署、监控和容灾，确保稳定性和数据摆放的合理性
熟练掌握C++/Go/Python，具备系统级编程能力，能够编写高性能存储组件
深入理解Kubernetes和云原生存储技术（如PV、CSI），有机器学习系统开发经验
扎实的分布式系统原理，熟悉分布式缓存、文件系统或对象存储，能够设计高可用、高性能的存储架构
了解主流推理引擎（vLLM、SGLang）和GPU通信技术（NVLink、RDMA、NCCL），有KV Cache优化经验者优先

申请策略

提前了解字节跳动Seed团队的技术方向和公开分享（如技术博客、演讲），在面试中展现对团队工作的理解和热情
准备一个与存储或推理性能优化相关的深度技术案例，展示解决问题的能力
突出分布式存储系统设计经验，特别是涉及多级缓存、数据迁移、负载均衡的项目，附上性能提升数据（如延迟降低%、吞吐提升等）
展示Kubernetes和云原生相关实践，包括自定义CSI驱动、存储编排、Operator开发等
强调机器学习系统经验，如模型加载优化、推理引擎集成、KV Cache相关工作，最好有开源贡献或技术博客
如果参与过OSDI/SOSP/FAST等顶会论文发表，务必醒目列出
系统学习NVLink、RDMA、NCCL等高速网络通信技术，通过动手实验或开源项目加深理解
熟悉vLLM或SGLang等推理引擎的源码，特别是内存管理和KV Cache部分

面试指南

在面对系统优化问题时，采用“问题分析-方案设计-实验验证”的框架：先明确瓶颈指标，对比不同方案的trade-off，再通过实验数据证明效果
在架构设计题中，使用“需求分解-分层设计-关键细节”结构：先梳理功能和非功能需求，再划分层次（接入层、缓存层、存储层），最后讨论数据一致性、可靠性等关键点
请描述你设计过的多级缓存系统，如何保证数据一致性和高命中率？
在大模型推理场景下，KV Cache的存储和访问有哪些关键优化点？
Kubernetes中如何实现一个自定义的CSI存储插件？请简述架构和关键设计
解释NVLink和RDMA在GPU间数据传输中的作用，以及在使用中可能遇到的性能瓶颈
如果模型加载成为推理瓶颈，你会从哪些方面进行优化？
复习分布式存储经典论文（如GFS、Bigtable、Alluxio），理解其设计哲学，并能结合实际场景分析

职位点评

综合评分

大厂核心AI团队，前沿技术栈和高薪资，但工作强度大，WLB一般。

更适合这类人

适合追求技术成长、渴望在AI基础设施领域深耕、能接受高强度工作的求职者。

表现最好

成长发展

相对薄弱

工作生活

薪资福利80

成长发展95

工作生活40

使命价值85

薪资福利

80较高

薪资水平在AI大厂中属于偏高区间，但JD未提及具体福利，稳定性与公司平台相关。

薪资信号偏高 (40K-60K/月)

成长发展

95较高

技术栈前沿（大模型、高性能存储、GPU通信），团队重视创新且有顶会发表机会，成长空间大。

技术前沿前沿/新兴技术

技术栈C++、Go、Python、Kubernetes、分布式系统、NVLink、RDMA、NCCL、GPU Direct、vLLM、SGLang、PyTorch

业务类型profit_center

工作生活

40较低

未明确提及WLB，大厂AI团队通常节奏较快，可能需要加班，办公地点为北京核心区但通勤可能受限。

工作模式未明确

办公地点市区核心地段

加班情况未提及（无法判断）

使命价值

85较高

团队致力于通用智能探索，技术影响力大，产品服务亿级用户，社会价值显著。

行业发展高速增长赛道

社会影响正向社会影响力较高

创新程度积极采用新技术

Watch Jobs

大模型推理存储系统专家-Seed

职位详情

关于这个职位

最低要求

工作职责

优先资格

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

大模型推理存储系统专家-Seed

职位详情

关于这个职位

最低要求

工作职责

优先资格

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

字节跳动 的其他在招职位

客户端安全工程师

区域配送商务Leader-TikTok Shop

零售行业高级解决方案经理-火山引擎

C端内容产品设计师-生活服务（上海）

云原生产品专家-微服务

相似职位推荐

高级 WLAN 开发工程师

服务端高级研发工程师

AI 开发工程师（Agent 方向）

腾讯云全球CDN后台开发工程师(深圳)

游戏测试开发工程师-新星引力计划

字节跳动 的其他在招职位

客户端安全工程师

区域配送商务Leader-TikTok Shop

零售行业高级解决方案经理-火山引擎

C端内容产品设计师-生活服务（上海）

云原生产品专家-微服务

相似职位推荐

高级 WLAN 开发工程师

服务端高级研发工程师

AI 开发工程师（Agent 方向）

腾讯云全球CDN后台开发工程师(深圳)

游戏测试开发工程师-新星引力计划

字节跳动的其他在招职位

字节跳动的其他在招职位