Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/深度求索/AI超算集群运维工程师
Deepseek logo
D
深度求索 (Deepseek)

职位信息

浙江省-杭州市
中级经验
全职员工
仅现场办公
本科
普通员工/个人贡献者

标签

GPULLMRDMA自动化运维Ai超算集群
💡

核心评价

前沿AI超算运维,技术成长快,薪资有竞争力,但工作强度大、WLB一般。

AI超算集群运维工程师

🤖 AI 估测:¥25K-45K

发布时间:1 天前

立即应聘

ℹ️关于这个职位

该职位负责AI超算集群的日常运维、故障处理、资源交付与监控体系建设,确保集群稳定高效运行
你将接触前沿GPU服务器、RDMA网络等基础设施,并参与自动化运维工具链的开发
适合有Linux运维经验、熟悉GPU集群、追求技术深度的工程师

✓工作职责

负责AI超算集群中前沿服务器、加速卡等基础设施的日常运维工作,包括巡检、维修、故障定位与生命周期管理,缩短平均故障恢复时间(MTTR),保障集群持续稳定运行
负责新一代计算资源的快速交付与上线,完成节点的基线检查与性能验证工作,确保资源能够高质量高性能投入生产
负责建设和优化面向AI超算集群的监控、告警与可观测性体系,实现集群健康状态的实时感知
构建自动化运维工具链,提升故障自愈率与运维效率,降低人工干预成本

⭐最低要求

本科及以上学历,计算机、电子、通信、自动化或相关专业优先
具备 Linux 服务器运维经验,熟悉集群环境下的系统管理、故障排查与性能分析
熟悉 GPU/AI 加速卡服务器、RDMA 网络等相关基础设施,有实际运维经验者优先
具备良好的脚本或自动化能力,能够使用 Shell、Python、LLM等工具提升运维效率
具备良好的沟通协作能力、责任心和现场问题推动能力,能在跨团队协同场景下高效推进问题解决

👍优先资格

有大规模AI超算集群(千卡以上)运维经验
有机房交付、批量上架、集群 bring-up、验收测试经验
有 GPU 服务器压测、性能基线建立、异常案例归因和优化经验
具备监控体系建设经验(如Prometheus、Grafana等),有可观测性平台落地经验者优先
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

深度求索 的其他在招职位

  • 多模态安全-模型策略产品经理

    深度求索

    北京市 · 仅现场办公

  • 企业文化主管

    深度求索

    杭州市 · 仅现场办公

  • 会计

    深度求索

    杭州市 · 仅现场办公

  • 采购经理

    深度求索

    杭州市 · 仅现场办公

  • 高级行政专员(北京)

    深度求索

    北京市 · 仅现场办公

相似职位推荐

  • IT服务主管

    叠纸游戏

    上海市 · 仅现场办公

  • 网络运维工程师

    多点数智

    北京市 · 仅现场办公

  • Assistant IT Manager

    怡和洋行

    Hong Kong · 仅现场办公

  • DBA-26届春招

    东方财富

    上海市 · 仅现场办公

  • 运维工程师-26届春招

    东方财富

    上海市 · 仅现场办公