字节跳动的MLOps技术专家-Seed薪资是多少？

该职位薪资范围为 45k–80k（人民币/月）。

MLOps技术专家-Seed的工作地点在哪里？

该职位工作地点位于北京市。工作形式为仅现场办公。

该职位要求本科学历及高级经验工作经验。

🤖 AI 估测：¥45K-80K

发布时间：大约 1 个月前

这是一个专注于大规模生成式AI（如大语言模型、文生图、文生视频）的MLOps技术专家岗位

你将负责保障AI训练与推理系统的稳定性与性能，设计高效的资源调度与算力集群管理体系，并推动MLOps工程化最佳实践的落地

该职位要求你具备扎实的系统工程能力和解决复杂技术问题的经验，是连接算法研究与工程实现的关键角色

负责大规模生成式AI核心场景（LLM、T2I、T2V、生成理解等）的训练系统与异构推理系统稳定性保障，主导性能极致优化，解决训练中断、推理延迟、吞吐量瓶颈等核心问题

设计并迭代灵活高效的资源调度体系，提升调度效率、资源利用率与调度可解释性，支撑多类型任务（训推/离线推理/在线服务）的精细化调度与优先级管理

主导大规模高速网络（RDMA）与异构算力集群（GPU/国产算力）的规划、部署、运维与优化，保障集群拓扑合理性、网络带宽稳定性与算力资源高效输

负责高性能存储系统的架构设计、选型与运维，保障存储IO性能、数据可靠性与稳定性，适配大规模训练与推理的数据存取需求

把控容量交付全流程质量，制定科学的容量规划方案，结合业务增长预测完成资源扩容与配置优化，确保容量供应及时、稳定且经济

推动训推算力并池混部体系建设，优化离线推理等场景的算力资源利用率，构建算力提效与成本管控的运营体系，沉淀提效方法论

保障在线复杂业务与工程架构的稳定性，建立覆盖训推全链路的监控、告警与故障自愈机制，快速响应并解决生产环境中的复杂技术问题

对接算法、业务与运维团队，输出MLOps技术解决方案，沉淀大规模生成式AI场景下的工程化最佳实践，推动团队技术能力提升

本科及以上学历，计算机科学、软件工程等相关专业，3年及以上大规模机器学习/生成式AI MLOps相关工作经验

熟练掌握Python/Go编程语言，具备扎实的Linux环境开发与运维能力，精通Shell脚本编写，能独立完成自动化工具开发

精通容器化技术（Docker/Kata）与编排工具（Kubernetes），具备大规模异构算力集群（GPU/NPU）的部署、运维与优化经验

熟悉大规模高速网络技术（RDMA）、高性能存储系统（分布式存储/对象存储）的原理与运维，具备相关系统优化实战经验

精通资源调度系统设计与优化，具备调度策略迭代、资源利用率提升的实战经验，理解调度可解释性的核心设计要点

具备大规模生成式AI（LLM/生图/生视频）训练/推理系统稳定性保障与性能优化经验，能快速定位并解决训推全链路的复杂技术问题

具备训推算力并池混部、离线推理算力提效相关项目经验，理解算力运营的核心指标与优化方向

具备优秀的沟通协调能力、跨团队协作精神与自驱力，有强烈的责任心

加分项：

有大规模LLM、文生图、文生视频等生成式AI模型工程化落地全流程经验者优先

具备多云/混合云环境下异构算力集群管理与容量规划经验者优先

熟悉分布式训练框架与推理优化工具，具备相关性能调优经验者优先

具备大规模网络性能调优（RDMA带宽/延迟优化）、存储IO性能瓶颈突破经验者优先

有大规模复杂算力交付、运营体系搭建经验，具备成本管控、资源利用率提升量化成果者优先

拥有大规模分布式系统架构设计与故障演练经验者优先

MLOps技术专家-Seed

🤖 AI 估测：¥45K-80K

发布时间：大约 1 个月前