Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/深度求索/运营运维工程师
Deepseek logo
D
深度求索 (Deepseek)

职位信息

浙江省-杭州市
中级经验
全职员工
仅现场办公
学历未注明
普通员工/个人贡献者

标签

AI基础设施系统稳定性OpenTelemetry运维自动化监控告警
💡

核心评价

技术前沿的AI基础设施运维岗,成长空间大,意义感强,但WLB等信息不明。

运营运维工程师

🤖 AI 估测:¥25K-45K

发布时间:22 天前

立即应聘

ℹ️关于这个职位

这是一个专注于保障大规模AI业务稳定性的技术岗位
你将负责DeepSeek ToC全链路业务的运维工作,包括构建和维护面向亿级日活的AI基础设施,优化系统稳定性和可观测性,并开发内部基建工具以实现运维自动化
工作环境涵盖从公有云到自建机房,再到万卡GPU集群的复杂技术栈

✓工作职责

为面向亿级日活的 AI 基础设施的构建与维护,提供专业的稳定性和架构改善方案
负责持续优化系统稳定性、可观测性,深入参与业务和系统的监控与 Troubleshooting 工作
负责内部基建的开发与运维自动化,提高人效

⭐最低要求

有扎实的编程功底,熟练脚本语言(Python,Bash 等),熟练掌握 SQL,有较强动手能力
熟悉 K8S 集群运维、多集群管理、集群容灾多活
熟悉 Linux,熟悉计算机网络、操作系统基础知识
熟悉开源 OpenTelemetry 可观测生态 log、metric、trace 最佳实践及相关工具
有责任感,能够及时处理线上故障告警,合作意识好
有线上系统的运维管理经验,熟悉各类监控、告警基础设施,能帮助完善各种监控、告警工具链

👍优先资格

【加分项】了解LLM训练/推理流程,熟悉GPU/RDMA的问题诊断,提高集群稳定性
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

深度求索 的其他在招职位

  • AI超算集群运维工程师

    深度求索

    杭州市 · 仅现场办公

  • 多模态安全-模型策略产品经理

    深度求索

    北京市 · 仅现场办公

  • 企业文化主管

    深度求索

    杭州市 · 仅现场办公

  • 会计

    深度求索

    杭州市 · 仅现场办公

  • 采购经理

    深度求索

    杭州市 · 仅现场办公

相似职位推荐

  • 数据安全工程师

    中国平安

    上海市 · 仅现场办公

  • 应用安全工程师

    中国平安

    深圳市 · 仅现场办公

  • 应用运维工程师

    中国平安

    深圳市 · 仅现场办公

  • DBA岗

    中国平安

    上海市 · 仅现场办公

  • 高性能系统工程师 - 校招

    小马智行

    北京市 · 仅现场办公