Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
大模型推理存储系统专家-Seed
立即应聘

大模型推理存储系统专家-Seed

发布于 大约 17 小时前

普通员工/个人贡献者

北京市
高级经验
全职员工
仅现场办公
学历未注明
分布式系统
GO
RDMA
NVLINK
SGLang
vLLM
Gpu Direct

AI 估算 · 40k–60k

前沿AI基础设施岗位,技能稀缺,大厂核心团队,薪资竞争力强

职位详情

关于这个职位

作为字节跳动Seed团队的大模型推理存储系统专家,你将负责设计和开发多层级存储系统,优化大模型推理中的KV Cache、数据IO和模型加载,提升推理性能

团队致力于通用智能研究,技术栈前沿,涉及Kubernetes、分布式系统、高速网络等,适合有系统存储经验、希望深耕AI基础设施的工程师

最低要求

熟练掌握Linux环境下的C++/Go/Python/Shell等1至2种以上语言

熟悉Kubernetes架构和生态,熟悉PV/CSI等云原生容器存储技术,有丰富的机器学习系统实践和开发经验
掌握分布式系统原理,参与过分布式系统的设计、开发和维护
有优秀的逻辑分析能力,能够对业务逻辑进行合理的抽象和拆分
有强烈的工作责任心,较好的学习能力、沟通能力和自驱力,能够快速的响应和行动
有良好的工作文档习惯,及时按要求撰写更新工作流程及技术文档

工作职责

负责机器学习系统存储相关组件的设计和开发,服务于大模型推理的各业务场景(LLM/S2S/VLM/多模态等),包括模型分发加载、KV Cache存储和优化,数据IO性能优化,提高推理TTFT、TBT等核心性能指标

负责设计和实现面向大模型推理的多层级存储系统,综合利用显存、本地内存、分布式内存/磁盘、远端大容量存储系统(HDFS/对象存储)等多种介质进行数据的存储和迁移管理,实现「近计算缓存+远端大容量存储」的一体化分级系统
负责优化大模型KV Cache命中率,从推理框架,流量调度,多级缓存等多个系统纬度入手定制化优化策略
优化数据的读取性能,充分利用近计算侧的NVLink、RDMA高速网络、GPU Direct技术实现数据的高效传输
优化数据副本的存放策略,实现负载流量和存储数据的合理化分布
负责设计和实现高效、易用的数据访问接口,实现和推理框架、引擎的无缝对接,管理KV Cache的生命周期
负责Kubernetes场景下多级存储系统的接入、管理、运维、监控及多机房、多地域、多云场景的系统搭建和容灾,确保稳定性并优化跨集群的数据摆放

优先资格

熟悉至少一种主流的机器学习框架/推理引擎(例如vLLM/SGLang/PyTorch)

有大模型推理相关的技术落地经验,比如:KV Cache相关优化的实现
熟悉分布式缓存系统(例如Alluxio/JuiceFS/GooseFS/JindoFS)等
熟悉NVLink、RDMA、NCCL、GPU Direct等技术
在计算机系统存储顶会(包括但不限于OSDI/SOSP/FAST)上有文章发表经验

AI 洞察

优缺点分析

优点

  • 平台优势:字节跳动作为大厂,拥有海量算力和业务场景,技术资源丰富,个人影响力放大,成果可落地到豆包、火山引擎等千万级应用
  • 团队实力:Seed团队在AI领域有长期愿景,研究方向涵盖多模态、科学计算等,技术氛围浓厚,内部交流机会多

缺点 / 挑战

  • 技术前沿:直接参与大模型推理存储这一AI基础设施的核心环节,接触最新硬件加速技术和分布式系统挑战,技能积累快、含金量高
  • 技术难度高:系统涉及GPU、存储、网络多层面的协同优化,需要对底层硬件和系统软件有深刻理解,调试调优极具挑战
  • 工作强度大:大模型业务迭代快,推理性能要求极高,可能面临紧迫的交付压力和较大的加班强度
  • 竞争激烈:作为大厂核心团队,内部人才密度高,需要持续学习保持竞争力,对自驱力和抗压能力要求较高
  • 适合有分布式系统或存储背景、对AI基础设施充满热情、喜欢解决性能瓶颈问题、能承受高强度技术攻关的工程师

角色解读

  • 技术纵深:成为AI基础设施领域的存储专家,在大模型推理性能优化方向持续深耕,解决行业级难题
  • 架构视野:设计跨集群、多层级的分级存储系统,积累大规模分布式系统架构经验,向系统架构师发展
  • 团队领导:表现优异者可带领技术小组,负责关键技术方向的攻关,逐步转向技术管理岗位
  • 设计和实现基于Kubernetes的多层级存储系统,管理GPU显存、本地内存、分布式存储和远端对象存储之间的数据流动,优化推理过程中模型参数和KV Cache的加载效率
  • 优化KV Cache命中率和数据传输性能,利用NVLink、RDMA等高速互联技术减少延迟,提升推理引擎的TTFT和TBT等关键指标
  • 开发高效的数据访问接口,与vLLM、SGLang等推理框架集成,管理KV Cache的生命周期,实现存储与计算的紧密协同
  • 负责多机房和跨集群的存储系统部署、监控和容灾,确保稳定性和数据摆放的合理性
  • 熟练掌握C++/Go/Python,具备系统级编程能力,能够编写高性能存储组件
  • 深入理解Kubernetes和云原生存储技术(如PV、CSI),有机器学习系统开发经验
  • 扎实的分布式系统原理,熟悉分布式缓存、文件系统或对象存储,能够设计高可用、高性能的存储架构
  • 了解主流推理引擎(vLLM、SGLang)和GPU通信技术(NVLink、RDMA、NCCL),有KV Cache优化经验者优先

申请策略

  • 提前了解字节跳动Seed团队的技术方向和公开分享(如技术博客、演讲),在面试中展现对团队工作的理解和热情
  • 准备一个与存储或推理性能优化相关的深度技术案例,展示解决问题的能力
  • 突出分布式存储系统设计经验,特别是涉及多级缓存、数据迁移、负载均衡的项目,附上性能提升数据(如延迟降低%、吞吐提升等)
  • 展示Kubernetes和云原生相关实践,包括自定义CSI驱动、存储编排、Operator开发等
  • 强调机器学习系统经验,如模型加载优化、推理引擎集成、KV Cache相关工作,最好有开源贡献或技术博客
  • 如果参与过OSDI/SOSP/FAST等顶会论文发表,务必醒目列出
  • 系统学习NVLink、RDMA、NCCL等高速网络通信技术,通过动手实验或开源项目加深理解
  • 熟悉vLLM或SGLang等推理引擎的源码,特别是内存管理和KV Cache部分

面试指南

  • 在面对系统优化问题时,采用“问题分析-方案设计-实验验证”的框架:先明确瓶颈指标,对比不同方案的trade-off,再通过实验数据证明效果
  • 在架构设计题中,使用“需求分解-分层设计-关键细节”结构:先梳理功能和非功能需求,再划分层次(接入层、缓存层、存储层),最后讨论数据一致性、可靠性等关键点
  • 请描述你设计过的多级缓存系统,如何保证数据一致性和高命中率?
  • 在大模型推理场景下,KV Cache的存储和访问有哪些关键优化点?
  • Kubernetes中如何实现一个自定义的CSI存储插件?请简述架构和关键设计
  • 解释NVLink和RDMA在GPU间数据传输中的作用,以及在使用中可能遇到的性能瓶颈
  • 如果模型加载成为推理瓶颈,你会从哪些方面进行优化?
  • 复习分布式存储经典论文(如GFS、Bigtable、Alluxio),理解其设计哲学,并能结合实际场景分析

匹配度报告

75
综合匹配度

大厂核心AI团队,前沿技术栈和高薪资,但工作强度大,WLB一般。

适合人群
适合追求技术成长、渴望在AI基础设施领域深耕、能接受高强度工作的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利80
成长发展95
工作生活40
使命价值85

薪资福利匹配

80较高

薪资水平在AI大厂中属于偏高区间,但JD未提及具体福利,稳定性与公司平台相关。

薪资信号偏高 (40K-60K/月)

成长发展匹配

95较高

技术栈前沿(大模型、高性能存储、GPU通信),团队重视创新且有顶会发表机会,成长空间大。

技术前沿前沿/新兴技术
技术栈C++、Go、Python、Kubernetes、分布式系统、NVLink、RDMA、NCCL、GPU Direct、vLLM、SGLang、PyTorch
业务类型profit_center

工作生活匹配

40较低

未明确提及WLB,大厂AI团队通常节奏较快,可能需要加班,办公地点为北京核心区但通勤可能受限。

工作模式未明确
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

85较高

团队致力于通用智能探索,技术影响力大,产品服务亿级用户,社会价值显著。

行业发展高速增长赛道
社会影响正向社会影响力较高
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 高级/资深前端研发工程师-Dev Infra

    字节跳动 · 上海市
    AI 估算 · 25k-45k
  • 大数据后端开发工程师-内容质量

    字节跳动 · 北京市
    AI 估算 · 30k-50k
  • B端营销专家-抖音电商

    字节跳动 · 上海市
    AI 估算 · 25k-45k
  • 多模态大模型数据策略专家-AI数据与安全

    字节跳动 · 北京市
    AI 估算 · 40k-70k
  • AI搜索评测运营(评测分析方向)-AI数据与安全

    字节跳动 · 北京市
    AI 估算 · 25k-45k

相似职位推荐

  • AI工程化岗

    中国平安 · 深圳市
    AI 估算 · 25k-45k
  • AI工程化岗(安全领域)

    中国平安 · 深圳市
    AI 估算 · 35k-60k
  • AI工程化岗

    中国平安 · 深圳市
    AI 估算 · 35k-55k
  • AI工程化岗

    中国平安 · 深圳市
    AI 估算 · 30k-50k
  • AI工程化岗

    中国平安 · 深圳市
    AI 估算 · 20k-40k

字节跳动 的其他在招职位

  • 高级/资深前端研发工程师-Dev Infra

    字节跳动 · 上海市
    AI 估算 · 25k-45k
  • 大数据后端开发工程师-内容质量

    字节跳动 · 北京市
    AI 估算 · 30k-50k
  • B端营销专家-抖音电商

    字节跳动 · 上海市
    AI 估算 · 25k-45k
  • 多模态大模型数据策略专家-AI数据与安全

    字节跳动 · 北京市
    AI 估算 · 40k-70k
  • AI搜索评测运营(评测分析方向)-AI数据与安全

    字节跳动 · 北京市
    AI 估算 · 25k-45k

相似职位推荐

  • AI工程化岗

    中国平安 · 深圳市
    AI 估算 · 25k-45k
  • AI工程化岗(安全领域)

    中国平安 · 深圳市
    AI 估算 · 35k-60k
  • AI工程化岗

    中国平安 · 深圳市
    AI 估算 · 35k-55k
  • AI工程化岗

    中国平安 · 深圳市
    AI 估算 · 30k-50k
  • AI工程化岗

    中国平安 · 深圳市
    AI 估算 · 20k-40k