Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/字节跳动/机器学习平台SRE工程师-AML
ByteDance logo
B
字节跳动 (ByteDance)

职位信息

上海市
中级经验
全职员工
仅现场办公
学历未注明
普通员工/个人贡献者

标签

分布式系统SREGO自动化运维Gpu运维
💡

核心评价

技术前沿、成长迅速的大厂核心岗位,薪资竞争力强,但可能伴随较高的工作强度与责任压力。

机器学习平台SRE工程师-AML

🤖 AI 估测:¥35K-60K

发布时间:大约 1 个月前

立即应聘

ℹ️关于这个职位

这是一个专注于保障机器学习平台稳定、高效运行的SRE工程师岗位
你将负责管理GPU等异构计算资源,确保模型训练与部署流程顺畅,并通过开发自动化工具来提升运维效率和资源利用率
这是一个在大型互联网公司中,连接底层基础设施与上层AI应用的关键技术岗位

✓工作职责

负责机器学习系统的稳定运转,支持模型开发、训练与部署
负责GPU/NPU/CPU和存储等资源的管理与规划、成本与预算
负责多地域、多机房的系统容灾、服务部署管理和集群机器治理
开发自动化工具或平台,提升资源利用率和运维人效

⭐最低要求

三年以上运维开发项目经验
熟练掌握Linux环境下的Go/Python/Shell等1至2种以上语言
有大型分布式系统的资源管理和任务调度系统运维经验,熟悉Kubernetes生态和架构
有强烈的工作责任心,出色的学习能力、沟通能力和自驱力,良好的团队合作精神
有优秀的逻辑分析能力,能够对业务逻辑进行合理的抽象和拆分
有良好的工作文档习惯,及时按要求撰写更新工作流程及技术文档

👍优先资格

加分项:
从事过大规模分布式系统的运维
有GPU服务器的运维经验
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • AI产品经理(海外增长)-飞书

    字节跳动

    北京市 · 仅现场办公

  • 采购政策与合规专家

    字节跳动

    北京市 · 仅现场办公

  • 华南游戏行业销售经理-火山引擎

    字节跳动

    深圳市 · 仅现场办公

  • 高级后台开发工程师-Cross Platform

    字节跳动

    深圳市 · 仅现场办公

  • 前端开发专家/工程师-基础架构(北京)

    字节跳动

    北京市 · 仅现场办公

相似职位推荐

  • 数据安全工程师

    中国平安

    上海市 · 仅现场办公

  • 应用安全工程师

    中国平安

    深圳市 · 仅现场办公

  • 应用运维工程师

    中国平安

    深圳市 · 仅现场办公

  • DBA岗

    中国平安

    上海市 · 仅现场办公

  • 高性能系统工程师 - 校招

    小马智行

    北京市 · 仅现场办公