Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/腾讯/腾讯云-元宝SRE工程师
Tencent logo
T
腾讯 (Tencent)

职位信息

北京市
中级经验
全职员工
仅现场办公
本科
普通员工/个人贡献者

标签

GPUSREGOCI/CDCUDA分布式训练大模型
💡

核心评价

腾讯核心AI业务SRE岗,技术栈前沿复合,成长性极佳,薪资竞争力强,但需关注工作地点与强度。

腾讯云-元宝SRE工程师

🤖 AI 估测:¥35K-60K

发布时间:大约 1 个月前

立即应聘

ℹ️关于这个职位

这是一个专注于保障腾讯云AI模型服务平台(元宝)稳定、高效运行的SRE工程师岗位
你将负责从模型训练、部署到线上服务的全链路运维,通过自动化工具和架构优化,确保大规模AI服务的可用性、成本效益和性能表现

✓工作职责

负责元宝的稳定运行,支持开源Deepseek等模型服务训练与部署的多个环节
优化模型的部署流程,包括持续集成、持续部署( CI / CD )和自动化工具
负责集群管理和服务治理,设计容灾方案并实施演练,保障系统高可用和稳定性
负责资源成本管理与规划,优化计算和存储资源,提升机器学习任务的执行效率
分析 AI 硬件应用中的质量性能表现,提供系统技术支持能力,推动改进识别和落地
关注业界前沿技术动态,探索复杂业务系统运维自动化和智能化的技术和方向

⭐最低要求

本科及以上学历,3年以上工作经验,有机器学习平台相关开发或运维经验
熟练使用 Go /Python/ Shell 等一种或多种编程语言,善于使用自动化/智能化方法让服务稳定高效
熟悉容器技术,掌握K8s、 Docker 的技术原理,有实际使用和运维经验
深入了解GPU架构与并行计算,掌握CUDA编程实践,熟悉RDMA网络通信技术、NCCL集合通讯,大模型分布式训练与推理架构及模型压缩技术
对于AI大模型应用的构建、部署和维护过程有深入理解
有优秀的逻辑分析能力,能够对业务逻辑进行合理的抽象和拆分
具有良好的沟通协调能力,较好的团队合作精神、责任心和一定抗压能力
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

腾讯 的其他在招职位

  • 区域营销经理-西安

    腾讯

    西安市 · 仅现场办公

  • 《逆战:未来》-资深3D场景设计师

    腾讯

    广州市 · 仅现场办公

  • SLG-手游研发项目经理

    腾讯

    上海市 · 仅现场办公

  • 微信小店-产品策划-商品价格

    腾讯

    广州市 · 仅现场办公

  • S2—WXG财务管理

    腾讯

    深圳市 · 仅现场办公

相似职位推荐

  • 数据安全工程师

    中国平安

    上海市 · 仅现场办公

  • 应用安全工程师

    中国平安

    深圳市 · 仅现场办公

  • 应用运维工程师

    中国平安

    深圳市 · 仅现场办公

  • DBA岗

    中国平安

    上海市 · 仅现场办公

  • 高性能系统工程师 - 校招

    小马智行

    北京市 · 仅现场办公