Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/字节跳动/MLOps技术专家-Seed
ByteDance logo
B
字节跳动 (ByteDance)

职位信息

北京市
高级经验
全职员工
仅现场办公
本科
普通员工/个人贡献者

标签

分布式系统GPU性能优化GOMLOpsLLMRDMA资源调度
💡

核心评价

顶尖AI团队的核心工程岗,技术前沿、成长性极佳、使命感强,但WLB可能面临挑战。

MLOps技术专家-Seed

🤖 AI 估测:¥45K-80K

发布时间:大约 1 个月前

立即应聘

ℹ️关于这个职位

这是一个专注于大规模生成式AI(如大语言模型、文生图、文生视频)的MLOps技术专家岗位
你将负责保障AI训练与推理系统的稳定性与性能,设计高效的资源调度与算力集群管理体系,并推动MLOps工程化最佳实践的落地
该职位要求你具备扎实的系统工程能力和解决复杂技术问题的经验,是连接算法研究与工程实现的关键角色

✓工作职责

负责大规模生成式AI核心场景(LLM、T2I、T2V、生成理解等)的训练系统与异构推理系统稳定性保障,主导性能极致优化,解决训练中断、推理延迟、吞吐量瓶颈等核心问题
设计并迭代灵活高效的资源调度体系,提升调度效率、资源利用率与调度可解释性,支撑多类型任务(训推/离线推理/在线服务)的精细化调度与优先级管理
主导大规模高速网络(RDMA)与异构算力集群(GPU/国产算力)的规划、部署、运维与优化,保障集群拓扑合理性、网络带宽稳定性与算力资源高效输
负责高性能存储系统的架构设计、选型与运维,保障存储IO性能、数据可靠性与稳定性,适配大规模训练与推理的数据存取需求
把控容量交付全流程质量,制定科学的容量规划方案,结合业务增长预测完成资源扩容与配置优化,确保容量供应及时、稳定且经济
推动训推算力并池混部体系建设,优化离线推理等场景的算力资源利用率,构建算力提效与成本管控的运营体系,沉淀提效方法论
保障在线复杂业务与工程架构的稳定性,建立覆盖训推全链路的监控、告警与故障自愈机制,快速响应并解决生产环境中的复杂技术问题
对接算法、业务与运维团队,输出MLOps技术解决方案,沉淀大规模生成式AI场景下的工程化最佳实践,推动团队技术能力提升

⭐最低要求

本科及以上学历,计算机科学、软件工程等相关专业,3年及以上大规模机器学习/生成式AI MLOps相关工作经验
熟练掌握Python/Go编程语言,具备扎实的Linux环境开发与运维能力,精通Shell脚本编写,能独立完成自动化工具开发
精通容器化技术(Docker/Kata)与编排工具(Kubernetes),具备大规模异构算力集群(GPU/NPU)的部署、运维与优化经验
熟悉大规模高速网络技术(RDMA)、高性能存储系统(分布式存储/对象存储)的原理与运维,具备相关系统优化实战经验
精通资源调度系统设计与优化,具备调度策略迭代、资源利用率提升的实战经验,理解调度可解释性的核心设计要点
具备大规模生成式AI(LLM/生图/生视频)训练/推理系统稳定性保障与性能优化经验,能快速定位并解决训推全链路的复杂技术问题
具备训推算力并池混部、离线推理算力提效相关项目经验,理解算力运营的核心指标与优化方向
具备优秀的沟通协调能力、跨团队协作精神与自驱力,有强烈的责任心

👍优先资格

加分项:
有大规模LLM、文生图、文生视频等生成式AI模型工程化落地全流程经验者优先
具备多云/混合云环境下异构算力集群管理与容量规划经验者优先
熟悉分布式训练框架与推理优化工具,具备相关性能调优经验者优先
具备大规模网络性能调优(RDMA带宽/延迟优化)、存储IO性能瓶颈突破经验者优先
有大规模复杂算力交付、运营体系搭建经验,具备成本管控、资源利用率提升量化成果者优先
拥有大规模分布式系统架构设计与故障演练经验者优先
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • AI产品经理(海外增长)-飞书

    字节跳动

    北京市 · 仅现场办公

  • 采购政策与合规专家

    字节跳动

    北京市 · 仅现场办公

  • 华南游戏行业销售经理-火山引擎

    字节跳动

    深圳市 · 仅现场办公

  • 高级后台开发工程师-Cross Platform

    字节跳动

    深圳市 · 仅现场办公

  • 前端开发专家/工程师-基础架构(北京)

    字节跳动

    北京市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公