Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
机器学习平台存储研发工程师-Data AML
立即应聘

机器学习平台存储研发工程师-Data AML

发布于 1 天前

普通员工/个人贡献者

北京市
高级经验
全职员工
仅现场办公
学历未注明
机器学习
NLP
PyTorch
GO
分布式存储
CV
vLLM

AI 估算 · 30k–60k

北京大厂高级研发,存储方向稀缺,薪资竞争力强,月薪3-6万,年终奖通常2-4个月。

职位详情

关于这个职位

该职位负责构建和优化字节跳动机器学习平台的存储系统,为NLP、CV、Speech等方向的模型训练与推理提供高性能、多层次的数据存储与访问方案

你将设计多级存储架构,整合显存、内存、分布式存储等介质,并负责Kubernetes环境下的存储运维与容灾

最低要求

熟练掌握Linux环境下的C++/Go/Python/Shell等1至2种以上语言

熟悉Kubernetes架构和生态,熟悉PV/CSI等云原生容器存储技术,有丰富的机器学习系统实践和开发经验
掌握分布式系统原理,参与过分布式系统的设计、开发和维护
有优秀的逻辑分析能力,能够对业务逻辑进行合理的抽象和拆分
有强烈的工作责任心,较好的学习能力、沟通能力和自驱力,能够快速响应并采取行动
有良好的工作文档习惯,按要求及时撰写、更新工作流程及技术文档

工作职责

负责机器学习系统存储相关组件的设计和开发,服务于各方向场景(NLP/CV/Speech等)的模型训练、模型评估和模型推理

设计和实现面向训练/推理场景的多层级存储系统,综合利用显存、本地内存、分布式内存/磁盘、远端大容量存储系统(HDFS/对象存储)等多种介质进行数据的存储和迁移管理,实现「近计算缓存+远端大容量存储」的一体化分级系统,高效数据流动
负责Kubernetes场景下多级存储系统的接入、管理、运维、监控,确保稳定性
负责多机房、多地域、多云场景的系统搭建和容灾,优化跨集群的数据摆放

优先资格

熟悉至少一种主流的机器学习框架/推理引擎(例如vLLM/SGLang/PyTorch)

有大模型推理/训练相关的技术落地经验
熟悉分布式缓存系统(例如Alluxio、JuiceFS、GooseFS、JindoFS)等
熟悉NVLink、RDMA、NCCL、GPU Direct等技术

AI 洞察

优缺点分析

优点

  • 公司规模大,资源丰富,有来自顶级高校和工业界的优秀同事,成长空间大
  • 薪资待遇在业内具有竞争力,且股票期权收益可观
  • 需要同时对分布式存储和机器学习系统有深入理解,学习曲线较陡
  • 技术迭代快,需要持续跟进开源社区和学术界的新成果
  • 适合有分布式系统或存储背景、对AI基础设施有浓厚兴趣、抗压能力强且希望在技术深度上持续精进的工程师

缺点 / 挑战

  • 字节跳动Data AML是核心AI基础设施团队,技术挑战大,能接触到前沿的LLM存储需求
  • 业务发展快,可能面临较大的工作压力和On-Call需求

角色解读

  • 技术纵深:成为存储系统或分布式系统领域的专家,架构大规模存储平台
  • 横向扩展:可转向ML platform、AI Infra等方向,覆盖更多基础设施领域
  • 管理方向:从IC逐步成长为技术Leader,带领存储团队
  • 设计并开发机器学习场景下的多层级存储系统,融合显存、内存、分布式磁盘等多种存储介质
  • 优化数据在训练和推理流程中的流动效率,实现近计算缓存与远端大容量存储的协同
  • 在Kubernetes集群上部署和管理存储组件,保障高可用与稳定性
  • 参与多机房、多云的容灾与数据摆放策略设计
  • 精通C++/Go/Python至少一种语言,熟悉Linux系统编程
  • 深入理解Kubernetes及其存储生态,如PV、CSI
  • 掌握分布式系统原理(一致性、容错、负载均衡等),有实际开发经验
  • 了解主流ML框架和推理引擎,如PyTorch、vLLM

申请策略

  • 面试前了解字节跳动AML团队的技术博客和开源项目,展示热情
  • 准备一个完整的分布式系统设计案例,包括架构、选型、性能分析
  • 突出分布式系统设计项目经验,尤其是存储系统或缓存系统相关
  • 展示Kubernetes使用和存储插件开发的经历,如CSI Driver实现
  • 强调在机器学习训练/推理场景下的性能优化案例,如数据加载、梯度通信等
  • 列出熟悉的技术栈:C++/Go、Kubernetes、分布式文件系统等
  • 深入学习Kubernetes存储生态,动手实现一个简单的CSI Driver
  • 了解主流分布式缓存系统(如Alluxio、JuiceFS)的架构和原理

面试指南

  • 从需求出发:明确训练/推理的数据访问模式(顺序/随机,读/写比,延迟敏感度)
  • 分层设计:区分热/温/冷数据,利用不同介质的性能差异,设计缓存策略
  • 工程细节:考虑元数据管理、数据迁移、容错机制,以及Kubernetes集成
  • 请设计一个多级存储系统,用于大模型训练,如何做数据生命周期管理?
  • Kubernetes中PV和PVC是如何工作的?如何实现一个自定义CSI Driver?
  • 在分布式存储中,如何处理数据一致性和故障恢复?
  • 在训练场景下,如何优化数据读取性能,减少GPU空闲等待?
  • 你对Alluxio或JuiceFS这样的缓存系统了解多少?谈谈它们的优缺点

匹配度报告

74
综合匹配度

大厂核心AI基础设施,顶尖技术栈,薪资优渥但工作节奏快、WLB一般。

适合人群
最适合追求技术成长和薪资回报的求职者,愿意在AI基础设施领域深耕,不介意快节奏工作。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展90
工作生活50
使命价值70

薪资福利匹配

85较高

该职位薪资在业界处于高水平,字节跳动福利完善(五险一金、补充医疗、餐补等),且为已上市大厂,稳定性较高。但具体薪资为面议,未披露。

薪资信号面议 (30K-60K/月)

成长发展匹配

90较高

职位涉及前沿AI基础设施技术(多级存储、Kubernetes、大模型),技术栈新,挑战大,有充足的学习和成长空间。团队内部有丰富的技术分享和导师制度。

技术前沿前沿/新兴技术
技术栈Kubernetes、vLLM、PyTorch、Alluxio、JuiceFS、NVLink、RDMA、NCCL、GPU Direct
业务类型ambiguous

工作生活匹配

50较低

工作地点在北京核心区域,但未提及远程或弹性办公,互联网大厂普遍工作节奏快,可能出现加班。无明确WLB相关描述。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

70中等

该职位服务于AI基础设施,间接推动AI技术发展,但具体业务价值偏底层基础设施,社会影响力有限。行业属于高速增长的AI赛道。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • AI平台研发工程师-集团信息系统

    字节跳动 · 深圳市
    AI 估算 · 25k-45k
  • 国际业务内容商务拓展专家-Dola

    字节跳动 · 北京市
    AI 估算 · 35k-65k
  • 商业化营销策略专家-抖音生活服务

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • HRBP-中国公共职能(北京)

    字节跳动 · 北京市
    AI 估算 · 20k-30k
  • 产品经理(导航/路线/路况)-地理位置中台

    字节跳动 · 北京市
    AI 估算 · 25k-40k

相似职位推荐

  • Java开发工程师(联盟) - 【商业化】

    快手 · 北京市
    AI 估算 · 18k-28k
  • 后端AI Agent 工程师

    中国平安 · 深圳市
    AI 估算 · 20k-40k

字节跳动 的其他在招职位

  • AI平台研发工程师-集团信息系统

    字节跳动 · 深圳市
    AI 估算 · 25k-45k
  • 国际业务内容商务拓展专家-Dola

    字节跳动 · 北京市
    AI 估算 · 35k-65k
  • 商业化营销策略专家-抖音生活服务

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • HRBP-中国公共职能(北京)

    字节跳动 · 北京市
    AI 估算 · 20k-30k
  • 产品经理(导航/路线/路况)-地理位置中台

    字节跳动 · 北京市
    AI 估算 · 25k-40k

相似职位推荐

  • Java开发工程师(联盟) - 【商业化】

    快手 · 北京市
    AI 估算 · 18k-28k
  • 后端AI Agent 工程师

    中国平安 · 深圳市
    AI 估算 · 20k-40k