Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业定价
我的收藏免费试用登录注册

PINGAN logo
中国平安
IaaS运维高级工程师
立即应聘

IaaS运维高级工程师

发布于 大约 2 个月前

普通员工/个人贡献者

深圳市
高级经验
全职员工
仅现场办公
本科
信息技术与基础设施
数据中心
GPU
CUDA
NCCL

AI 估算 · 25k–40k

GPU运维稀缺,大厂高级岗位薪资竞争力强,深圳互联网中高端水平。

职位详情

关于这个职位

该职位负责大规模物理服务器和GPU服务器的部署与运维,涉及自动化、监控和性能调优

你将主导AI训练与推理的底层基础设施,保障系统高可用性,适合深度技术控

最低要求

本科及以上学历,计算机、通信、电子或相关专业

5年以上服务器运维经验,具备大规模数据中心运维背景者优先
精通Linux系统(如CentOS、Ubuntu、Rocky Linux)的安装、配置、优化与故障排查
熟悉主流服务器品牌的硬件架构与管理工具(iDRAC、iLO、BMC等)
具备GPU服务器运维经验,熟悉NVIDIA GPU驱动、CUDA、NCCL、NVIDIA Driver、NVLink、GPUDirect等技术
熟练掌握Shell/Python脚本编程,能编写自动化运维脚本
熟悉监控系统(Prometheus + Grafana、Zabbix、ELK等)的搭建与使用
了解TCP/IP、VLAN、BGP等网络基础知识,能配合网络团队完成服务器网络配置

工作职责

负责大规模物理服务器集群(含GPU服务器)的部署、配置、监控、维护与优化,保障系统高可用性与稳定性

主导GPU服务器(如NVIDIA A100/H100等)的部署、驱动安装、CUDA环境配置及性能调优,支持AI训练与推理业务
设计并实施服务器自动化运维方案,包括系统初始化、固件升级、配置管理、批量部署等,提升运维效率
负责服务器硬件故障诊断与处理,协调厂商进行维修与更换,建立完善的硬件生命周期管理机制
搭建和维护服务器监控体系(如Prometheus、Zabbix、Grafana等),实现对CPU、内存、磁盘、GPU利用率、温度、功耗等关键指标的实时监控与告警
配合DevOps团队实现CI/CD流程中对物理资源的自动化调度与管理
编写和维护技术文档,包括部署手册、故障处理SOP、应急预案等
参与机房基础设施规划,协助完成服务器上架、网络布线、电源管理等现场运维工作
跟踪GPU、AI计算、高性能计算(HPC)等领域的最新技术趋势,推动运维体系持续演进

优先资格

熟悉Ansible、SaltStack、Puppet等配置管理工具者优先

AI 洞察

优缺点分析

优点

  • 大厂平台,接触前沿GPU技术和AI基础设施,技术含金量高
  • 大规模数据中心运维经验,职业发展空间广阔
  • 薪资待遇优厚,技能稀缺性强,市场竞争力突出
  • 运维工作可能涉及24/7 on-call,工作强度较大
  • 技术栈复杂,需要持续学习GPU、HPC等新兴领域

缺点 / 挑战

  • 大规模集群故障处理压力大,需快速响应能力
  • 适合热爱底层系统、对GPU和AI基础设施有浓厚兴趣、追求技术深度与挑战的运维工程师

角色解读

  • 向SRE专家或运维架构师方向发展,构建大规模基础设施
  • 深入AI基础设施领域,成为GPU集群调优专家
  • 可转云计算平台或数据中心管理岗位
  • 负责大规模物理服务器和GPU服务器的部署、配置与维护,保障系统高可用
  • 主导GPU驱动、CUDA环境配置及性能调优,支持AI训练与推理
  • 设计自动化运维方案,提升批量部署和故障处理效率
  • 搭建监控体系,实时跟踪硬件指标并处理告警
  • 精通Linux系统及Shell/Python脚本编程
  • 熟悉GPU服务器相关技术栈(NVIDIA驱动、CUDA、NCCL等)
  • 掌握自动化运维工具(Ansible等)和监控系统(Prometheus+Grafana)

申请策略

  • 了解平安云的业务方向和AI落地场景,展现对金融科技运维的兴趣
  • 突出大规模服务器运维经验,尤其是GPU集群相关项目
  • 强调自动化脚本开发成果(如部署工具、监控方案)
  • 列出掌握的Linux内核调优和硬件故障处理案例
  • 强化NVIDIA CUDA、NCCL等GPU技术栈的学习
  • 熟悉Ansible等配置管理工具,提升自动化能力

面试指南

  • 采用STAR法则:情境-任务-行动-结果,用具体数据说明
  • 对于设计类问题,从需求分析、方案对比、实施方案逐层展开
  • 描述一次大规模服务器故障处理的全过程
  • 如何对GPU服务器进行性能调优?
  • 请设计一个服务器自动化运维方案,包括部署和监控
  • Linux内核参数(如内存、CPU调度)如何优化?
  • 监控系统选型时你考虑哪些因素?如何搭建高可用监控?
  • 回顾以往运维项目细节,准备好数据(如服务器规模、故障率)

匹配度报告

66
综合匹配度

大厂IaaS运维,GPU前沿技术,高薪但WLB一般。

适合人群
适合追求技术成长和薪资回报、能接受较大工作强度的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展90
工作生活30
使命价值60

薪资福利匹配

85较高

大厂薪资水平较高,稳定性强,但JD未透露具体福利与年终奖,薪酬信号明确。

薪资信号未披露(AI估算:25K-40K/月)

成长发展匹配

90较高

岗位涉及GPU、AI基础设施等前沿技术,成长路径清晰,技能稀缺性强,发展空间大。

技术前沿前沿/新兴技术
技术栈GPU、CUDA、NCCL、Prometheus、Ansible
业务类型cost_center

工作生活匹配

30较低

仅现场办公,未提及WLB,运维岗位常需on-call,工作强度可能较高。

工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值匹配

60中等

金融科技行业稳定,但岗位主要为支撑性运维,社会影响力一般,创新水平积极。

行业发展稳定成熟行业
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

中国平安 的其他在招职位

  • 运营管理岗

    中国平安 · 上海市
    AI 估算 · 20k-40k
  • 高级产品经理

    中国平安 · 深圳市
    AI 估算 · 25k-40k
  • 后端开发-交易界面终端

    中国平安 · 上海市
    AI 估算 · 20k-35k
  • 算法工程师

    中国平安 · 深圳市
    AI 估算 · 25k-40k
  • 算法工程师-保险营销推荐及风控

    中国平安 · 深圳市
    AI 估算 · 25k-45k

相似职位推荐

  • 微信搜索-AI Infra 工程师-大模型推理方向(深圳)(广州)

    腾讯 · 深圳市
    AI 估算 · 30k-60k
  • 混元预训练数据工程负责人-PretrainData Workflow&溯源管理

    腾讯 · 深圳市
    AI 估算 · 50k-80k
  • 信息安全运营工程师-数据安全方向-实习生(顺丰科技)

    顺丰速运 · 深圳市
    AI 估算 · 4k-8k
  • 信息安全运营工程师-办公安全方向-实习生(顺丰科技)

    顺丰速运 · 深圳市
    AI 估算 · 4k-7k
  • SJZT数据开发工程师

    顺丰速运 · 深圳市
    AI 估算 · 20k-35k

中国平安 的其他在招职位

  • 运营管理岗

    中国平安 · 上海市
    AI 估算 · 20k-40k
  • 高级产品经理

    中国平安 · 深圳市
    AI 估算 · 25k-40k
  • 后端开发-交易界面终端

    中国平安 · 上海市
    AI 估算 · 20k-35k
  • 算法工程师

    中国平安 · 深圳市
    AI 估算 · 25k-40k
  • 算法工程师-保险营销推荐及风控

    中国平安 · 深圳市
    AI 估算 · 25k-45k

相似职位推荐

  • 微信搜索-AI Infra 工程师-大模型推理方向(深圳)(广州)

    腾讯 · 深圳市
    AI 估算 · 30k-60k
  • 混元预训练数据工程负责人-PretrainData Workflow&溯源管理

    腾讯 · 深圳市
    AI 估算 · 50k-80k
  • 信息安全运营工程师-数据安全方向-实习生(顺丰科技)

    顺丰速运 · 深圳市
    AI 估算 · 4k-8k
  • 信息安全运营工程师-办公安全方向-实习生(顺丰科技)

    顺丰速运 · 深圳市
    AI 估算 · 4k-7k
  • SJZT数据开发工程师

    顺丰速运 · 深圳市
    AI 估算 · 20k-35k