Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/字节跳动/大模型推理存储系统专家-Seed
ByteDance logo
B
字节跳动 (ByteDance)

职位信息

浙江省-杭州市
高级经验
全职员工
仅现场办公
学历未注明
普通员工/个人贡献者

标签

分布式系统GO存储系统RDMA大模型推理Kv CacheGpu Direct
💡

核心评价

技术顶尖、成长性极强的大厂核心AI基础设施岗,薪资竞争力高,但WLB可能面临挑战。

大模型推理存储系统专家-Seed

🤖 AI 估测:¥45K-80K

发布时间:大约 1 个月前

立即应聘

ℹ️关于这个职位

这是一个专注于大模型推理场景的存储系统专家岗位
你将负责设计和开发高性能、多层级存储系统,优化KV Cache命中率和数据IO性能,以提升大模型推理的核心指标(如TTFT、TBT)
工作涉及与推理框架、Kubernetes及多种存储介质的深度集成,服务于字节跳动Seed团队的前沿AI研究与应用

✓工作职责

负责机器学习系统存储相关组件的设计和开发,服务于大模型推理的各业务场景(LLM/S2S/VLM/多模态等),包括模型分发加载、KV Cache存储和优化,数据IO性能优化,提高推理TTFT、TBT等核心性能指标
负责设计和实现面向大模型推理的多层级存储系统,综合利用显存、本地内存、分布式内存/磁盘、远端大容量存储系统(HDFS/对象存储)等多种介质进行数据的存储和迁移管理,实现「近计算缓存+远端大容量存储」的一体化分级系统
负责优化大模型KV Cache命中率,从推理框架,流量调度,多级缓存等多个系统纬度入手定制化优化策略
优化数据的读取性能,充分利用近计算侧的NVLink、RDMA高速网络、GPU Direct技术实现数据的高效传输
优化数据副本的存放策略,实现负载流量和存储数据的合理化分布
负责设计和实现高效、易用的数据访问接口,实现和推理框架、引擎的无缝对接,管理KV Cache的生命周期
负责Kubernetes场景下多级存储系统的接入、管理、运维、监控,确保稳定性
负责多机房、多地域、多云场景的系统搭建和容灾,优化跨集群的数据摆放

⭐最低要求

熟练掌握Linux环境下的C++/Go/Python/Shell等1至2种以上语言
熟悉Kubernetes架构和生态,熟悉PV/CSI等云原生容器存储技术,有丰富的机器学习系统实践和开发经验
掌握分布式系统原理,参与过大规模分布式系统的设计、开发和维护
有优秀的逻辑分析能力,能够对业务逻辑进行合理的抽象和拆分
有强烈的工作责任心,较好的学习能力、沟通能力和自驱力,能够快速的响应和行动
有良好的工作文档习惯,及时按要求撰写更新工作流程及技术文档

👍优先资格

加分项:
熟悉至少一种主流的机器学习框架/推理引擎(例如vLLM/SGLang/PyTorch)
有大模型推理相关的技术落地经验,比如:KVCache相关优化的实现
熟悉分布式缓存系统(例如Alluxio/JuiceFS/GooseFS/JindoFS)等
熟悉NVLink、RDMA、NCCL、GPU Direct等技术
在计算机系统存储顶会(包括但不限于OSDI/SOSP/FAST)上有文章发表经验
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • AI产品经理(海外增长)-飞书

    字节跳动

    北京市 · 仅现场办公

  • 采购政策与合规专家

    字节跳动

    北京市 · 仅现场办公

  • 华南游戏行业销售经理-火山引擎

    字节跳动

    深圳市 · 仅现场办公

  • 高级后台开发工程师-Cross Platform

    字节跳动

    深圳市 · 仅现场办公

  • 前端开发专家/工程师-基础架构(北京)

    字节跳动

    北京市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公