Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

SF EXPRESS logo
顺丰速运
AI运维工程师
立即应聘

AI运维工程师

发布于 大约 15 小时前

普通员工/个人贡献者

深圳市
高级经验
全职员工
仅现场办公
本科
信息技术与基础设施
PyTorch
TensorFlow
LLM
RDMA
GPU集群
NCCL
AIOps
Ai运维

AI 估算 · 30k–50k

AI运维工程师需求旺盛,深证高级岗位薪资30-50K,顺丰大厂福利稳定,中位数40K*14月。

职位详情

关于这个职位

作为顺丰速运的AI运维工程师,你将负责大规模GPU/NPU集群的稳定性与性能优化,保障AI训练和推理任务的持续高效运行

通过AIOps和LLM技术实现运维自动化和智能诊断,提升基础设施的可靠性和资源利用率
这是一个技术深度与业务价值并重的岗位,适合对AI基础设施和运维自动化有热情的工程师

最低要求

基础技术栈:本科及以上学历,3年以上运维/SRE经验,有AI基础设施运维经验

精通Linux、TCP/IP/RDMA网络、Docker/K8s(GPU调度),熟练使用Prometheus、Grafana、Loki/ELK及Python/Go/Shell
AI领域实践:了解主流AI框架(PyTorch/TensorFlow)原理及通信库(NCCL/HCCL),熟悉K8s生态,有大规模GPU集群排障实战(如NCCL超时、慢节点识别)
AIOps与LLM应用能力:具备时序异常检测、日志聚类、根因定位等AIOps落地经验
熟悉LangChain、RAG、Prompt Engineering,能将大模型集成到运维系统(自动诊断、脚本生成)
软素质与加分项:强责任心和抗压能力,能快速响应故障
良好的跨团队协作意愿
有万卡集群运维经验或开源贡献者优先

工作职责

AI基础设施稳定性运维:负责大规模GPU/NPU集群、高性能网络(RoCE/IB)、分布式存储的部署、监控、容量规划与日常保障,通过故障自愈、自动重调度、Checkpoint恢复等机制降低MTTR

性能优化与资源管理:定位并解决推理中的性能瓶颈(GPU利用率、通信带宽、数据加载),优化异构资源调度策略,减少碎片化,保障AI任务高效连续运行
运维AI化提效:开发智能运维场景(异常检测、根因分析、告警收敛、容量预测),利用AI实现自然语言查询、故障诊断与脚本生成,建设自动化运维平台(扩缩容、隔离修复、智能调度)
数据驱动与知识沉淀:分析历史监控与日志数据,输出优化报告
建立运维知识库及故障案例库,借助AI辅助问答持续提升团队效率

优先资格

有万卡集群运维经验或开源贡献者优先

AI 洞察

优缺点分析

优点

  • 顺丰是物流行业巨头,AI基础设施投入大,平台稳定,项目体量可观
  • 岗位涉及前沿技术(GPU集群、AIOps、LLM),技能积累价值高,市场竞争力强
  • 工作直接支持核心AI业务,成就感强,且跨团队协作能拓展人脉
  • 需要持续跟进AI框架和LLM技术的最新演进,学习曲线陡峭
  • 适合有3年以上运维/SRE经验、对AI基础设施有强烈兴趣,并且具备快速学习和抗压能力的工程师

缺点 / 挑战

  • 大规模GPU集群运维复杂度高,故障响应压力大,需快速解决问题
  • 涉及多团队协作,沟通成本较高,需平衡业务需求与运维规范

角色解读

  • 在技术深度上,可向AI基础设施架构师发展,专攻超大规模集群设计与优化
  • 在管理方向上,可晋升为运维团队Leader,负责团队建设和运维策略制定
  • 结合AIOps和LLM趋势,可转型为智能运维平台架构师或AI平台开发专家
  • 负责大规模GPU/NPU集群的部署、监控和稳定保障,通过自动化手段降低故障恢复时间
  • 分析推理性能瓶颈,优化GPU利用率和网络通信效率,提高AI任务运行效率
  • 开发智能运维工具,利用AIOps和LLM实现异常检测、自动诊断和脚本生成
  • 沉淀运维知识库,通过数据驱动持续改进基础设施的可靠性和资源利用率
  • 精通Linux系统、TCP/IP网络及RDMA协议,熟悉Kubernetes和Docker的GPU调度
  • 掌握主流AI框架(PyTorch/TensorFlow)及通信库(NCCL),有大规模GPU集群排障经验
  • 具备AIOps落地经验,熟悉时序异常检测、日志聚类和根因定位
  • 熟悉LLM应用开发(LangChain、RAG等),能将大模型集成到运维场景

申请策略

  • 在简历中量化成果,如将MTTR降低XX%、GPU利用率提升XX%
  • 关注顺丰技术博客或开源动态,突显对公司的了解和热情
  • 突出GPU集群运维经验,如集群规模、排障案例(NCCL超时、慢节点识别)
  • 展示AIOps落地项目,特别是异常检测、根因分析或自动化故障恢复的实际成果
  • 强调LLM集成经验,如用LangChain构建自动诊断工具或脚本生成系统
  • 列出熟悉的技术栈:Kubernetes、Docker、Prometheus、Grafana、Python/Go等
  • 如果缺乏LLM应用经验,可学习LangChain框架和RAG技术,通过开源项目实践
  • 巩固Kubernetes GPU调度知识,了解Kata Containers等安全容器方案

面试指南

  • 对于排障问题,采用STAR原则:情境、任务、行动、结果,重点突出技术细节和量化效果
  • 对于架构设计问题,从需求分析、方案选型、优缺点对比和落地效果四个层面回答
  • 对于趋势问题,结合行业现状和个人经验,展示技术视野和思考深度
  • 描述一次你处理大规模GPU集群故障的经历,如何定位和恢复?
  • 如何优化Kubernetes上的GPU调度以减少碎片化?
  • AIOps在你们团队是如何落地的?具体实现了哪些功能?
  • 你如何将LLM集成到运维系统中?请举例说明
  • 你如何看待AI运维工程师的未来发展方向?

匹配度报告

70
综合匹配度

大厂AI运维高岗,前沿技术驱动,薪资面议有竞争力,但WLB不确定。

适合人群
适合高度关注技能成长和技术前沿的求职者,能接受现场办公和潜在高压。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利75
成长发展88
工作生活50
使命价值65

薪资福利匹配

75中等

薪资面议但基于大厂和高级岗位,预计竞争力强,福利稳定,但未明确具体数字。

薪资信号面议 (30K-50K/月)

成长发展匹配

88较高

岗位涉及GPU集群、AIOps、LLM等前沿技术,成长空间大,但JD未明确提及晋升通道。

技术前沿前沿/新兴技术
技术栈GPU集群、Kubernetes、AIOps、LLM、PyTorch、TensorFlow、NCCL、LangChain
业务类型ambiguous

工作生活匹配

50较低

现场办公,深圳市区可能交通便利,但大规模运维可能存在on-call压力,JD未提及WLB。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

65中等

物流行业稳定,AI运维支持公司核心业务,有一定社会价值,但JD未明确使命感描述。

行业发展稳定成熟行业
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

顺丰速运 的其他在招职位

  • 储备网点负责人

    顺丰速运 · 武汉市
    AI 估算 · 8k-15k
  • 大模型应用开发工程师

    顺丰速运 · 深圳市
    AI 估算 · 30k-50k
  • 产品经理-WMS

    顺丰速运 · 深圳市
    AI 估算 · 25k-40k
  • 助理工业区客户经理

    顺丰速运 · 上海市
    AI 估算 · 8k-15k
  • 区域客户经理

    顺丰速运 · 沈阳市
    AI 估算 · 8k-15k

相似职位推荐

  • Sr. Assoc, Business Analyst, WRB Tech

    渣打银行 · 广州市
    AI 估算 · 25k-40k
  • 数据安全研发工程师

    月之暗面 · 北京市
    AI 估算 · 25k-45k
  • 运维工程师

    中国平安 · 深圳市
    AI 估算 · 15k-25k
  • IT Business Analyst - CET Employee Experience

    罗氏 · 上海市
    AI 估算 · 20k-35k
  • 基础平台负责人

    中国平安 · 深圳市
    AI 估算 · 45k-65k

顺丰速运 的其他在招职位

  • 储备网点负责人

    顺丰速运 · 武汉市
    AI 估算 · 8k-15k
  • 大模型应用开发工程师

    顺丰速运 · 深圳市
    AI 估算 · 30k-50k
  • 产品经理-WMS

    顺丰速运 · 深圳市
    AI 估算 · 25k-40k
  • 助理工业区客户经理

    顺丰速运 · 上海市
    AI 估算 · 8k-15k
  • 区域客户经理

    顺丰速运 · 沈阳市
    AI 估算 · 8k-15k

相似职位推荐

  • Sr. Assoc, Business Analyst, WRB Tech

    渣打银行 · 广州市
    AI 估算 · 25k-40k
  • 数据安全研发工程师

    月之暗面 · 北京市
    AI 估算 · 25k-45k
  • 运维工程师

    中国平安 · 深圳市
    AI 估算 · 15k-25k
  • IT Business Analyst - CET Employee Experience

    罗氏 · 上海市
    AI 估算 · 20k-35k
  • 基础平台负责人

    中国平安 · 深圳市
    AI 估算 · 45k-65k