Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

SF EXPRESS logo
顺丰速运
AI运维工程师
立即应聘

AI运维工程师

发布于 大约 18 小时前

普通员工/个人贡献者

深圳市
高级经验
全职员工
仅现场办公
本科
信息技术与基础设施
PyTorch
RAG
GO
TensorFlow
LLM
NCCL
AIOps
RoCE
Gpu/Npu集群

AI 估算 · 25k–40k

深圳AI运维岗位稀缺,需掌握GPU集群及AIOps技能,大厂薪资具有竞争力。

职位详情

关于这个职位

该职位负责顺丰AI基础设施的稳定性和性能优化,涵盖GPU/NPU集群运维、高性能网络与分布式存储管理,以及通过AIOps和LLM技术提升运维智能化水平

适合具备大规模集群运维经验、熟悉AI框架和云原生技术栈的资深工程师,工作地点深圳

最低要求

基础技术栈:本科及以上学历,3年以上运维/SRE经验,有AI基础设施运维经验

精通Linux、TCP/IP/RDMA网络、Docker/K8s(GPU调度),熟练使用Prometheus、Grafana、Loki/ELK及Python/Go/Shell
AI领域实践:了解主流AI框架(PyTorch/TensorFlow)原理及通信库(NCCL/HCCL),熟悉K8s生态,有大规模GPU集群排障实战(如NCCL超时、慢节点识别)
AIOps与LLM应用能力:具备时序异常检测、日志聚类、根因定位等AIOps落地经验
熟悉LangChain、RAG、Prompt Engineering,能将大模型集成到运维系统(自动诊断、脚本生成)
软素质与加分项:强责任心和抗压能力,能快速响应故障
良好的跨团队协作意愿
有万卡集群运维经验或开源贡献者优先

工作职责

AI基础设施稳定性运维:负责大规模GPU/NPU集群、高性能网络(RoCE/IB)、分布式存储的部署、监控、容量规划与日常保障,通过故障自愈、自动重调度、Checkpoint恢复等机制降低MTTR

性能优化与资源管理:定位并解决推理中的性能瓶颈(GPU利用率、通信带宽、数据加载),优化异构资源调度策略,减少碎片化,保障AI任务高效连续运行
运维AI化提效:开发智能运维场景(异常检测、根因分析、告警收敛、容量预测),利用AI实现自然语言查询、故障诊断与脚本生成,建设自动化运维平台(扩缩容、隔离修复、智能调度)
数据驱动与知识沉淀:分析历史监控与日志数据,输出优化报告
建立运维知识库及故障案例库,借助AI辅助问答持续提升团队效率

AI 洞察

优缺点分析

优点

  • 职位聚焦AI运维前沿方向(AIOps+LLM),技能稀缺,市场价值高
  • 大厂平台稳定,附带完善的福利体系(虽未具体说明,但上市企业通常五险一金、补充医疗等齐全)
  • 需7x24小时待命处理故障,抗压能力要求高,工作强度大
  • 技术栈覆盖广(网络、存储、K8s、AI框架、AIOps),学习成本高
  • 岗位对跨团队协作要求高,需与算法、研发、业务部门紧密配合
  • 适合有3年以上运维/SRE经验,对AI基础设施和AIOps有浓厚兴趣,能承受高压的资深工程师

缺点 / 挑战

  • 顺丰作为物流巨头,AI基础设施投入大,可接触万卡级GPU集群,技术挑战高,成长快

角色解读

  • 可向AI基础设施架构师或运维平台技术负责人发展,主导下一代运维体系设计
  • 横向拓展至AI平台研发或全栈AI工程方向,结合AIOps与LLM打造智能化运维产品
  • 在物流行业深耕,成为物流AI基础设施领域的专家,推动行业数字化转型
  • 负责大规模GPU/NPU集群的部署、监控、容量规划及日常故障自愈,保障AI基础设施稳定运行
  • 定位并解决推理中的性能瓶颈,优化GPU利用率、通信带宽与资源调度策略
  • 开发智能运维场景,如异常检测、根因分析、告警收敛,并利用LLM实现自然语言查询和自动诊断
  • 精通Linux、TCP/IP/RDMA网络、Docker/K8s(GPU调度)及Prometheus等监控工具
  • 熟悉PyTorch/TensorFlow框架及NCCL/HCCL通信库,具备大规模GPU集群排障经验
  • 具备AIOps落地经验(时序异常检测、日志聚类、根因定位)和LLM应用能力(LangChain、RAG)

申请策略

  • 顺丰强调业务落地,准备1-2个用AI提升运维效率的具体方案,展示业务理解
  • 面试前了解顺丰物流业务场景,思考AI运维如何赋能降本增效
  • 突出大规模GPU集群运维经验,量化集群规模(如XX节点)、故障处理时效(MTTR)等
  • 重点展示AIOps项目落地案例(异常检测、告警收敛等),以及LLM集成运维系统的实践
  • 如有CKA、CKAD等K8s认证或NCCL调优经验,务必列出
  • 补强RDMA网络(RoCE/IB)和分布式存储相关知识
  • 深入学习LangChain和RAG应用开发,尝试构建一个简单的LLM运维助手

面试指南

  • 对于故障类问题:先明确故障现象,再逐层排查(网络、存储、调度、应用),最后给出优化方案
  • 对于AIOps问题:从数据采集、特征工程、模型选择、部署反馈闭环的流程阐述,强调落地效果
  • 对于LLM应用:结合RAG流程、Prompt Engineering技巧,说明如何保证输出准确性和可解释性
  • 如何设计一个万卡GPU集群的故障自愈机制?
  • 请解释NCCL超时的常见原因及排查步骤
  • 你如何用AIOps技术实现告警收敛和根因定位?
  • 请描述一个你使用LLM改进运维流程的实际案例
  • 如何优化K8s上GPU任务的调度,减少资源碎片?

职位点评

66
综合评分

顺丰AI运维岗,技术前沿、成长性强,但工作强度大、WLB较差。

更适合这类人
最适合追求技术成长、希望接触前沿AI基础设施和高并发场景的求职者,不适合重视WLB的人群。
表现最好
成长发展
相对薄弱
工作生活
薪资福利70
成长发展90
工作生活30
使命价值75

薪资福利

70中等

薪资面议,但大厂上市企业整体薪酬福利有保障,不过具体金额未知,工作强度大可能影响性价比。

薪资信号面议 (25K-40K/月)

成长发展

90较高

技术栈前沿(GPU集群、AIOps、LLM),接触万卡规模,成长路径清晰,技能稀缺性强。

技术前沿前沿/新兴技术
技术栈GPU、NPU、Kubernetes、Prometheus、AIOps、LLM、LangChain、RAG、NCCL、RoCE
成长机会知识沉淀、故障案例库、智能运维场景开发
业务类型profit_center

工作生活

30较低

未提远程或弹性工作,强调快速响应故障,工作强度大,WLB较差。

工作模式仅现场办公
办公地点市区核心地段
加班情况JD含高强度暗示词

使命价值

75中等

物流AI基础设施属于高速增长赛道,技术创新性强,但社会影响力中性。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

顺丰速运 的其他在招职位

  • 测试开发工程师

    顺丰速运 · 深圳市
    AI 估算 · 15k-25k
  • 软件开发项目管理经理

    顺丰速运 · 深圳市
    AI 估算 · 30k-50k
  • 交付管理高级顾问

    顺丰速运 · 上海市
    AI 估算 · 20k-35k
  • 工业区客户经理

    顺丰速运 · 中山市
    AI 估算 · 6k-10k
  • 售前解决方案

    顺丰速运 · 北京市
    AI 估算 · 25k-40k

相似职位推荐

  • AI软件解决方案专家(FDE)(深圳/北京/上海)

    腾讯 · 深圳市
    AI 估算 · 30k-55k
  • AGENTIC AI Testing Lead, Global Delivery Simplification, VP

    道富公司 · 杭州市
    AI 估算 · 50k-80k
  • AGENTIC AI Testing Consultant, Global Delivery Simplification, AVP

    道富公司 · 杭州市
    AI 估算 · 30k-45k
  • 资深网络安全工程师(NTA方向)

    希音 · 产品研发中心
    AI 估算 · 18k-30k
  • MS Engineer (L1)

    NTT DATA · 上海市
    AI 估算 · 8k-12k

顺丰速运 的其他在招职位

  • 测试开发工程师

    顺丰速运 · 深圳市
    AI 估算 · 15k-25k
  • 软件开发项目管理经理

    顺丰速运 · 深圳市
    AI 估算 · 30k-50k
  • 交付管理高级顾问

    顺丰速运 · 上海市
    AI 估算 · 20k-35k
  • 工业区客户经理

    顺丰速运 · 中山市
    AI 估算 · 6k-10k
  • 售前解决方案

    顺丰速运 · 北京市
    AI 估算 · 25k-40k

相似职位推荐

  • AI软件解决方案专家(FDE)(深圳/北京/上海)

    腾讯 · 深圳市
    AI 估算 · 30k-55k
  • AGENTIC AI Testing Lead, Global Delivery Simplification, VP

    道富公司 · 杭州市
    AI 估算 · 50k-80k
  • AGENTIC AI Testing Consultant, Global Delivery Simplification, AVP

    道富公司 · 杭州市
    AI 估算 · 30k-45k
  • 资深网络安全工程师(NTA方向)

    希音 · 产品研发中心
    AI 估算 · 18k-30k
  • MS Engineer (L1)

    NTT DATA · 上海市
    AI 估算 · 8k-12k