Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

ByteDance logo
字节跳动
大模型训练存储系统专家-Seed
立即应聘

大模型训练存储系统专家-Seed

发布于 2 天前

普通员工/个人贡献者

杭州市
专家级经验
全职员工
仅现场办公
学历未注明
信息技术与基础设施
机器学习
分布式系统
GO
存储系统
SSD
对象存储
大模型训练

AI 估算 · 50k–80k

字节跳动大模型核心团队,技术难度高,市场稀缺,薪资竞争力强,参考同级别专家岗。

职位详情

关于这个职位

该职位是字节跳动Seed团队的核心技术岗位,专注于大模型训练场景下的存储系统设计与优化

你将负责数据加载、模型状态持久化、文件系统、Kubernetes存储接入及多数据中心调度等工作,直接支撑豆包、即梦等明星产品的AI训练效率

最低要求

熟练掌握Linux环境下的C++/Go/Python/Shell等1至2种以上语言

熟悉Kubernetes架构和生态,熟悉PV/CSI等云原生容器存储技术,有丰富的机器学习系统实践和开发经验
掌握分布式系统原理,参与过分布式系统的设计、开发和维护
有优秀的逻辑分析能力,能够对业务逻辑进行合理的抽象和拆分
有强烈的工作责任心,较好的学习能力、沟通能力和自驱力,能够快速的响应和行动
有良好的工作文档习惯,及时按要求撰写更新工作流程及技术文档

工作职责

负责机器学习系统存储相关组件的设计和开发,服务于各方向场景(LLM/CV/Speech等)的数据加载模块和模型状态持久化,从而优化任务IO性能,提升有效训练时间

负责设计和实现面向机器学习场景的文件系统,使用内存、SSD、HDD以及云端对象存储等介质进行数据的持久化存储和管理,均衡的优化存储性能与成本
负责Kubernetes场景下各类存储系统的接入、管理、治理、监控
负责多机房、多地域、多云场景的在任务数据联合调度,优化跨区域数据传输,实现负载的合理化分布

优先资格

熟悉至少一种主流的机器学习框架(如PyTorch/Megatron-LM)

熟悉Fuse用户态文件系统,分布式缓存系统(如Alluxio),云原生存储编排系统(如Fluid)等
熟悉操作系统内核,高性能RDMA网络通信等
在计算机系统存储顶会(包括但不限于OSDI/SOSP/FAST)上有文章发表经验

AI 洞察

优缺点分析

优点

  • 加入字节跳动Seed团队,接触前沿大模型训练技术,技术天花板高
  • 工作内容涉及分布式系统、存储、Kubernetes等热门方向,技能积累丰富
  • 大厂背景,薪资优厚,职业发展空间广阔
  • 岗位要求极高,需要同时掌握多个技术领域(分布式、存储、K8s、ML)
  • 需要快速学习和迭代,适应AI领域的高速变化

缺点 / 挑战

  • 大模型训练对性能和稳定性要求严苛,工作压力可能较大
  • 适合有深厚分布式系统或存储背景,对AI基础设施有热情,渴望挑战技术难题的资深工程师

角色解读

  • 成为AI基础设施领域的存储架构专家,主导下一代训练存储方案
  • 横向扩展到多模态、机器人等更前沿的AI场景,提升系统设计视野
  • 向技术管理方向转型,带领存储团队,参与顶层技术决策
  • 设计并开发机器学习训练场景下的存储系统组件,包括数据加载、模型状态持久化,优化IO性能
  • 构建面向ML的自定义文件系统,融合内存、SSD、HDD及云对象存储,平衡性能与成本
  • 管理Kubernetes环境中的存储接入和治理,保障多集群、多地域下的数据调度效率
  • 精通C++/Go/Python,熟悉Linux系统编程
  • 深入理解Kubernetes存储生态(PV/CSI)及分布式系统原理
  • 具备大规模机器学习训练系统的实践经验,熟悉存储性能优化

申请策略

  • 在简历中明确标注与ML训练存储相关的项目,即使非直接相关也要体现系统性思考
  • 关注Seed团队的技术博客或开源项目,面试时展示对团队工作的了解
  • 突出分布式存储系统的设计经验,尤其是大规模生产环境的优化案例
  • 展示Kubernetes存储实践(如CSI驱动开发、集群存储治理)
  • 提及机器学习训练系统的IO优化成果,最好有数据支撑
  • 系统梳理分布式存储理论,重点复习Ceph、Alluxio等开源方案
  • 深入学习Kubernetes存储机制,动手搭建CSI插件
  • 了解主流大模型训练框架(PyTorch、Megatron)的数据加载流程

面试指南

  • 对于系统设计类问题,先明确需求边界和约束(如规模、性能、成本),然后对比不同方案利弊,最后给出选型理由
  • 对于实践问题,遵循STAR原则:描述场景、任务、行动和结果,突出量化指标
  • 如何设计一套高效的数据加载系统来支撑千卡级大模型训练?
  • 请解释Kubernetes CSI的工作原理,以及你在实践中遇到的挑战
  • 分布式文件系统如何保证数据一致性?举一个你参与设计的例子
  • 在多数据中心场景下,如何优化跨地域数据传输?
  • 复习分布式存储经典论文(如GFS、Ceph),准备系统设计原型
  • 梳理过往项目中的性能优化案例,准备详细的技术细节

职位点评

74
综合评分

字节跳动大模型核心团队,前沿技术栈,高薪高成长,但WLB一般。

更适合这类人
最看重技术成长和前沿挑战的求职者,能够接受一定的加班和现场办公。
表现最好
成长发展
相对薄弱
工作生活
薪资福利85
成长发展90
工作生活40
使命价值80

薪资福利

85较高

字节跳动为上市大厂,薪资福利行业领先,该岗位为专家级,薪酬竞争力强,福利齐全。

薪资信号未披露(AI估算:50K-80K/月)

成长发展

90较高

岗位涉及大模型训练前沿技术,团队专注于AI创新,有大量技术挑战和成长空间,且公司内部晋升通道清晰。

技术前沿前沿/新兴技术
技术栈C++、Go、Python、Kubernetes、分布式存储、机器学习、大模型训练、RDMA
业务类型profit_center

工作生活

40较低

杭州现场办公,未提及弹性工作或远程,互联网大厂加班文化普遍,WLB可能一般。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值

80较高

团队使命是探索通用智能新方法,推动AI进步,社会影响力较高,技术前沿性强。

行业发展高速增长赛道
社会影响正向社会影响力较高
使命信号致力于寻找通用智能的新方法,追求智能上限,为科技和社会发展作出贡献
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 税务合规专家

    字节跳动 · 北京市
    AI 估算 · 20k-35k
  • 测试开发工程师-客服中台-北京

    字节跳动 · 北京市
    AI 估算 · 15k-30k
  • 安全检测工程师-安全与风控

    字节跳动 · 杭州市
    AI 估算 · 20k-35k
  • 高级测试开发工程师-抖音

    字节跳动 · 北京市
    AI 估算 · 30k-50k
  • 音视频技术支持专家-火山引擎

    字节跳动 · 深圳市
    AI 估算 · 20k-35k

相似职位推荐

  • AI软件解决方案专家(FDE)(深圳/北京/上海)

    腾讯 · 深圳市
    AI 估算 · 30k-55k
  • AGENTIC AI Testing Lead, Global Delivery Simplification, VP

    道富公司 · 杭州市
    AI 估算 · 50k-80k
  • AGENTIC AI Testing Consultant, Global Delivery Simplification, AVP

    道富公司 · 杭州市
    AI 估算 · 30k-45k
  • 应用架构高级工程师

    顺丰速运 · 深圳市
    AI 估算 · 30k-50k
  • AI运维工程师

    顺丰速运 · 深圳市
    AI 估算 · 25k-40k

字节跳动 的其他在招职位

  • 税务合规专家

    字节跳动 · 北京市
    AI 估算 · 20k-35k
  • 测试开发工程师-客服中台-北京

    字节跳动 · 北京市
    AI 估算 · 15k-30k
  • 安全检测工程师-安全与风控

    字节跳动 · 杭州市
    AI 估算 · 20k-35k
  • 高级测试开发工程师-抖音

    字节跳动 · 北京市
    AI 估算 · 30k-50k
  • 音视频技术支持专家-火山引擎

    字节跳动 · 深圳市
    AI 估算 · 20k-35k

相似职位推荐

  • AI软件解决方案专家(FDE)(深圳/北京/上海)

    腾讯 · 深圳市
    AI 估算 · 30k-55k
  • AGENTIC AI Testing Lead, Global Delivery Simplification, VP

    道富公司 · 杭州市
    AI 估算 · 50k-80k
  • AGENTIC AI Testing Consultant, Global Delivery Simplification, AVP

    道富公司 · 杭州市
    AI 估算 · 30k-45k
  • 应用架构高级工程师

    顺丰速运 · 深圳市
    AI 估算 · 30k-50k
  • AI运维工程师

    顺丰速运 · 深圳市
    AI 估算 · 25k-40k