Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/大疆/高级IT基础设施专家热招
DJI logo
D
大疆 (DJI)

职位信息

广东省-深圳市
高级经验
全职员工
仅现场办公
学历未注明
普通员工/个人贡献者

标签

PyTorch分布式训练资源调度GPU集群管理云原生Ai算力优化
💡

核心评价

技术前沿的大厂核心岗,高成长性,薪资竞争力强,但WLB可能面临挑战。

高级IT基础设施专家热招

🤖 AI 估测:¥35K-60K

发布时间:14 天前

立即应聘

ℹ️关于这个职位

这是一个专注于AI算力基础设施的高级技术岗位
你将负责大规模GPU/XPU算力集群的建设、交付与统一管理,支持大模型训练、在线推理等核心业务
同时,你需要监控资源使用、分析性能指标,并参与算力平台的架构设计与生命周期管理,推动生产集群向更高稳定性演进

✓工作职责

承担公司大规模算力集群的建设与交付,负责 GPU/XPU 等高性能加速卡资源的统一管理,支持大模型训练、在线推理、搜索、推荐等核心业务的稳定运行
熟悉主流 GPU 训练平台及分布式训练框架,了解 PyTorch、DeepSpeed、Megatron-LM 等在大规模集群中的训练特性,同时熟悉公有云上的云原生 GPU 训练平台(如 AWS、Azure、GCP、阿里云、火山引擎等)的调度、资源管理与训练流程
能够监控大规模 GPU 资源的使用情况,建立使用基线与性能指标体系,持续分析利用率、稳定性与异常模式,为资源规划、调度优化和容量管理提供依据
参与算力平台及相关服务的整体架构设计与生命周期管理,从规划、评审到部署上线,推动生产集群向更高稳定性与可持续性演进

⭐最低要求

三年以上云与AI基础设施相关工作经验,具备丰富的云平台管理和AI算力优化经验
具备网络规划、存储解决方案、云原生应用、GPU加速计算、AI算力优化、云计算架构等领域的专业知识
精通云基础设施、AI算力基础设施、混合云平台、资源调度、AI模型训练与推理等相关技术
熟悉GPU/CPU集群管理、Docker、Kubernetes、TensorFlow、PyTorch等工具和技术
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

大疆 的其他在招职位

  • 高级项目管理专家(IT PMO)

    大疆

    深圳市 · 仅现场办公

  • 中/高级广告投放岗(国内)

    大疆

    深圳市 · 仅现场办公

  • 中/高级广告投放岗(海外)

    大疆

    深圳市 · 仅现场办公

  • 中/高级结构评测工程师

    大疆

    深圳市 · 仅现场办公

  • 高级体验设计师

    大疆

    深圳市 · 仅现场办公

相似职位推荐

  • IT服务主管

    叠纸游戏

    上海市 · 仅现场办公

  • 网络运维工程师

    多点数智

    北京市 · 仅现场办公

  • Assistant IT Manager

    怡和洋行

    Hong Kong · 仅现场办公

  • DBA-26届春招

    东方财富

    上海市 · 仅现场办公

  • 运维工程师-26届春招

    东方财富

    上海市 · 仅现场办公