Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

DJI logo
大疆
中/高级运维工程师(AI平台)
立即应聘

中/高级运维工程师(AI平台)

发布于 大约 21 小时前

普通员工/个人贡献者

北京市
高级经验
全职员工
仅现场办公
本科
信息技术与基础设施
GPU
PyTorch
GO
RDMA
NCCL
对象存储
HDFS
vLLM
Megatron

AI 估算 · 30k–50k

大疆薪资有竞争力,高级运维工程师在北京月薪30-50K,考虑AI平台技术难度和大厂水平。

职位详情

关于这个职位

该职位负责大规模AI训练集群和推理服务的稳定性与高可用,涉及Kubernetes调度、GPU集群运维、大数据组件(Spark/Flink等)以及数据湖存储系统的运维

你将解决故障自愈、弹性伸缩等关键问题,保障AI数据产线稳定运行
适合具备Python/Go开发经验和K8S Operator经验的资深运维工程师

最低要求

本科及以上学历,具备5年以上相关经验

熟悉Python/Go,有K8S Operator开发经验
至少具备一项以下要求:
熟悉常见GPU硬件架构,了解NCCL通信库原理,RDMA通信
了解Pytorch/Megatron等训练框架,了解VLLM/TRT等推理框架
或
熟悉Spark/Flink/Hadoop等大数据组件,熟悉HDFS/Alluxio/对象存储等存储系统
熟悉数据湖技术(Hudi/Iceberg等),熟悉湖仓一体架构
对图像、视频、文本等非结构化数据的存储、访问模式有深入理解,熟悉数据清洗、预处理、特征工程等流水线的稳定性保障工作

工作职责

负责大规模AI训练集群的稳定性建设,解决大规模训练中的故障自愈、调度编排等问题

负责保障在离线推理服务的高可用和低延迟,包括:弹性伸缩、自动扩缩容策略等
负责保障AI数据产线,包括但不限于:数据清洗、标注、预处理等
负责大规模多模态数据湖、存储系统的运维,包括但不限于:Spark、Flink、Trino等

AI 洞察

优缺点分析

优点

  • 大疆是行业巨头,平台稳定,技术积累深厚
  • 接触前沿AI基础设施,涉及GPU集群、分布式训练等热门技术
  • 薪资水平在北京具有竞争力,福利完善
  • AI平台运维对综合能力要求高,需同时掌握网络、存储、计算、调度等多领域知识
  • 技术栈迭代快,需要持续学习紧跟业界进展
  • 适合具备深厚运维背景、熟悉K8S和AI基础设施,喜欢解决复杂系统问题的技术专家

缺点 / 挑战

  • 大规模集群的稳定性保障压力大,可能需要处理复杂故障和紧急问题

角色解读

  • 可向AI基础设施架构师方向发展,负责整个AI平台的设计和优化
  • 也可转向AI平台研发,深入开发调度系统或数据湖工具
  • 在大疆内部有丰富的算力和数据资源,适合积累大规模分布式系统经验
  • 负责大规模AI训练集群的稳定性,解决故障自愈和调度编排问题
  • 保障在离线推理服务的高可用和低延迟,实现弹性伸缩和自动扩缩容
  • 运维AI数据产线,包括数据清洗、标注、预处理等流水线
  • 管理多模态数据湖和存储系统,涉及Spark、Flink、Trino等组件
  • 精通Python或Go,并有K8S Operator开发经验
  • 理解GPU硬件架构、NCCL通信原理和RDMA网络
  • 熟悉深度学习训练框架(Pytorch/Megatron)或推理框架(VLLM/TRT)
  • 掌握大数据生态(Spark/Flink/Hadoop)和存储系统(HDFS/Alluxio/对象存储)

申请策略

  • 研究大疆AI平台的技术方向,特别是其在无人机、智能驾驶等领域的应用,展示兴趣
  • 在面试中准备一个复杂故障排查的案例,体现系统性思维
  • 突出K8S Operator开发经验,描述具体项目和成果
  • 强调GPU集群或大数据平台的运维案例,包括性能优化、故障处理等
  • 展示对深度学习框架或推理框架的理解,说明实际部署经验
  • 提及参与过AI数据产线或数据湖相关项目
  • 补充对NCCL、RDMA等网络通信原理的深入理解
  • 熟悉Pytorch分布式训练或VLLM推理框架的部署与调优

面试指南

  • 采用STAR法则:情景、任务、行动、结果,结构化描述实际案例
  • 对于故障排查类问题,先理清现象,再定位根因,最后给出解决方案和预防措施
  • 展示系统性思考:从架构层面分析问题,不仅关注单一组件
  • 描述你之前如何设计和实现一个K8S Operator?
  • 如何诊断GPU训练任务中的性能瓶颈?
  • 在AI推理服务中,如何实现弹性伸缩和低延迟?
  • 大数据Spark作业出现数据倾斜,你如何排查和解决?
  • 你如何保障数据湖的稳定性和数据一致性?

匹配度报告

70
综合匹配度

大疆北京AI平台运维岗,薪资优厚、技术前沿,但现场办公且未明确WLB。

适合人群
适合追求高薪、技术前沿且能接受现场办公的求职者。
最强匹配
薪资福利匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展80
工作生活50
使命价值65

薪资福利匹配

85较高

大疆薪资在北京处于上游水平,且福利完善,稳定性高,补偿性动机得到较好满足。

薪资信号未披露(AI估算:30K-50K/月)

成长发展匹配

80较高

该职位技术栈前沿,涉及AI基础设施核心组件,但JD中未明确提及培训或晋升通道。

技术前沿前沿/新兴技术
技术栈AI训练集群、GPU、K8S Operator、NCCL、RDMA、Pytorch、Megatron、VLLM、TRT、Spark、Flink、Hudi、Iceberg
业务类型profit_center

工作生活匹配

50较低

仅现场办公,地点在北京,未提及弹性工时或远程,生活化动机满足度一般。

工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值匹配

65中等

大疆在智能硬件和AI领域有较高影响力,但JD未提社会价值,意义感适中。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

大疆 的其他在招职位

  • 中/高级多媒体算法工程师(Sensor矫正算法)

    大疆 · 深圳市
    AI 估算 · 30k-55k
  • 高级产品经理(技术工程方向)

    大疆 · 深圳市
    AI 估算 · 35k-55k
  • 中/高级多媒体算法工程师(Tuning)

    大疆 · 深圳市
    AI 估算 · 25k-45k
  • 高级法律事务岗

    大疆 · 深圳市
    AI 估算 · 35k-55k
  • 资深信息安全管理专家(研发)

    大疆 · 深圳市
    AI 估算 · 35k-55k

相似职位推荐

  • Staff Machine Learning Engineer, ML Infrastructure - Online

    Unity Technologies · 上海市
    AI 估算 · 50k-80k
  • 运维工程开发实习生-【架构治理/SRE】

    快手 · 北京市
    AI 估算 · 4k-6k
  • AI服务DevOps工程师

    米哈游 · 上海市
    AI 估算 · 25k-45k
  • 22301-Digital Talent Trainee

    梅特勒托利多 · 上海市
    AI 估算 · 12k-18k
  • IT iNTERN

    美敦力 · 上海市
    AI 估算 · 4k-6k

大疆 的其他在招职位

  • 中/高级多媒体算法工程师(Sensor矫正算法)

    大疆 · 深圳市
    AI 估算 · 30k-55k
  • 高级产品经理(技术工程方向)

    大疆 · 深圳市
    AI 估算 · 35k-55k
  • 中/高级多媒体算法工程师(Tuning)

    大疆 · 深圳市
    AI 估算 · 25k-45k
  • 高级法律事务岗

    大疆 · 深圳市
    AI 估算 · 35k-55k
  • 资深信息安全管理专家(研发)

    大疆 · 深圳市
    AI 估算 · 35k-55k

相似职位推荐

  • Staff Machine Learning Engineer, ML Infrastructure - Online

    Unity Technologies · 上海市
    AI 估算 · 50k-80k
  • 运维工程开发实习生-【架构治理/SRE】

    快手 · 北京市
    AI 估算 · 4k-6k
  • AI服务DevOps工程师

    米哈游 · 上海市
    AI 估算 · 25k-45k
  • 22301-Digital Talent Trainee

    梅特勒托利多 · 上海市
    AI 估算 · 12k-18k
  • IT iNTERN

    美敦力 · 上海市
    AI 估算 · 4k-6k