Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/滴滴出行/CPG-AI集群工程师
DiDi logo
D
滴滴出行 (DiDi)

职位信息

北京市
高级经验
全职员工
仅现场办公
学历未注明
普通员工/个人贡献者

标签

GPU性能优化GOLinux内核RDMAAI集群国产Ai芯片
💡

核心评价

技术前沿的大厂AI基础设施核心岗,技能成长空间巨大,薪资竞争力强,但WLB可能面临挑战。

CPG-AI集群工程师

🤖 AI 估测:¥35K-60K

发布时间:14 天前

立即应聘

ℹ️关于这个职位

这是一个面向资深工程师的AI基础设施岗位,主要负责构建和优化滴滴出行大规模GPU计算集群
你将深度参与从硬件选型、Kubernetes调度系统开发到集群性能优化的全链路工作,支撑公司核心AI业务的万卡级算力需求,是AI算力平台的核心建设者

✓工作职责

Kubernetes调度与计算平台 资源调度与集群管理 - 设计和实现GPU算力调度系统,优化资源利用率和作业调度效率 - 负责Kubernetes节点组件(kubelet、container runtime)的稳定性、性能优化 - 深度排查Kubernetes集群复杂问题 计算平台与节点优化 - 参与服务器硬件选型、测试和验收,重点优化GPU服务器性能 - 推进国产AI芯片的生态适配 - 建立集群故障感知召回体系,提高AI计算资源利用率,维护线上集群稳定性 扩展方向:性能优化(附加项) - 参与AI集群网络优化(NCCL/RoCEv2),提升分布式训练通信效率 - 深入文件系统、缓存、镜像、cri细节,优化容器启动速度

⭐最低要求

必备技能 - 3年以上Kubernetes生产环境经验,精通调度机制和节点管 - 熟悉GPU资源管理(NVIDIA GPU Operator、GPU共享、拓扑感知调度) - 熟练掌握Go/Python语言,有Kubernetes源码阅读或二次开发经验 - 具备大规模集群(百节点以上)运维和故障排查能力 - 熟悉Linux系统原理,具备内核参数调优和性能优化经验

👍优先资格

优先考虑 - 有混合云/多云环境GPU资源管理经验 - 熟悉RDMA/RoCE等高速网络技术 - 具备AI训练集群性能调优经验 - 有国产AI芯片适配经验 - Kubernetes社区贡献者或相关开源项目经验
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

滴滴出行 的其他在招职位

  • 高级/资深 agent研发工程师

    滴滴出行

    北京市 · 仅现场办公

  • 策略运营专家

    滴滴出行

    北京市 · 仅现场办公

  • 渠道运营专家

    滴滴出行

    太原市 · 仅现场办公

  • 高级测试开发(agent)工程师

    滴滴出行

    北京市 · 仅现场办公

  • 策略运营专家

    滴滴出行

    北京市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公