Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/腾讯/腾讯云-元宝SRE工程师
Tencent logo
T
腾讯 (Tencent)

职位信息

重庆市
中级经验
全职员工
仅现场办公
本科
普通员工/个人贡献者

标签

SREGOCI/CDCUDARDMANCCL大模型
💡

核心评价

腾讯AI基础设施SRE岗,技术前沿、成长性强、平台优势明显,但需关注工作模式与潜在压力。

腾讯云-元宝SRE工程师

🤖 AI 估测:¥25K-45K

发布时间:大约 1 个月前

立即应聘

ℹ️关于这个职位

这是一个专注于保障腾讯云AI模型服务稳定与高效运行的SRE工程师岗位
你将负责Deepseek等大模型的训练与部署平台运维,通过自动化工具和集群管理,优化资源成本,确保系统高可用,并探索运维智能化方向

✓工作职责

负责元宝的稳定运行,支持开源Deepseek等模型服务训练与部署的多个环节
优化模型的部署流程,包括持续集成、持续部署( CI / CD )和自动化工具
负责集群管理和服务治理,设计容灾方案并实施演练,保障系统高可用和稳定性
负责资源成本管理与规划,优化计算和存储资源,提升机器学习任务的执行效率
分析 AI 硬件应用中的质量性能表现,提供系统技术支持能力,推动改进识别和落地
关注业界前沿技术动态,探索复杂业务系统运维自动化和智能化的技术和方向

⭐最低要求

本科及以上学历,3年以上工作经验,有机器学习平台相关开发或运维经验
熟练使用 Go /Python/ Shell 等一种或多种编程语言,善于使用自动化/智能化方法让服务稳定高效
熟悉容器技术,掌握K8s、 Docker 的技术原理,有实际使用和运维经验
深入了解GPU架构与并行计算,掌握CUDA编程实践,熟悉RDMA网络通信技术、NCCL集合通讯,大模型分布式训练与推理架构及模型压缩技术
对于AI大模型应用的构建、部署和维护过程有深入理解
有优秀的逻辑分析能力,能够对业务逻辑进行合理的抽象和拆分
具有良好的沟通协调能力,较好的团队合作精神、责任心和一定抗压能力
注:该岗位为腾讯集团旗下子公司岗位编制
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

腾讯 的其他在招职位

  • 区域营销经理-西安

    腾讯

    西安市 · 仅现场办公

  • 《逆战:未来》-资深3D场景设计师

    腾讯

    广州市 · 仅现场办公

  • SLG-手游研发项目经理

    腾讯

    上海市 · 仅现场办公

  • 微信小店-产品策划-商品价格

    腾讯

    广州市 · 仅现场办公

  • S2—WXG财务管理

    腾讯

    深圳市 · 仅现场办公

相似职位推荐

  • 数据安全工程师

    中国平安

    上海市 · 仅现场办公

  • 应用安全工程师

    中国平安

    深圳市 · 仅现场办公

  • 应用运维工程师

    中国平安

    深圳市 · 仅现场办公

  • DBA岗

    中国平安

    上海市 · 仅现场办公

  • 高性能系统工程师 - 校招

    小马智行

    北京市 · 仅现场办公