Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Moonshot AI logo
月之暗面
Kubernetes 调度器开发工程师
立即应聘

Kubernetes 调度器开发工程师

发布于 大约 17 小时前

普通员工/个人贡献者

北京市 / 深圳市
中级经验
全职员工
仅现场办公
学历未注明
分布式系统
GPU
性能优化
GO
集群管理
调度算法
eBPF

AI 估算 · 30k–50k

AI基础设施工程师稀缺,调度器开发需深厚系统能力,市场薪资偏高。B轮公司弹性中等。

职位详情

关于这个职位

该职位专注于深度定制 Kubernetes 调度器,为 AI 工作负载设计高效的调度策略

你需要攻克万卡级集群的调度性能瓶颈,构建异构资源调度体系,并研发高级调度能力以保障大模型训练和推理服务的性能
适合具备扎实 Go 语言和 Kubernetes 生态经验、对调度算法和分布式系统有深入理解的工程师

最低要求

计算机相关专业,3 年以上后端/基础架构开发经验

精通 Go 语言,深度掌握 Kubernetes 生态
扎实的调度算法基础(资源调度、任务调度、负载均衡、装箱优化),有大规模分布式系统设计与性能优化经验
熟悉 GPU 集群架构(NVLink/InfiniBand/RoCE),理解 AI 训练/推理任务对资源调度的特殊诉求
责任心强,深度理解业务问题,能主动拓展能力边界
具备出色的系统级问题定位能力,能通过代码级分析解决调度死锁、资源竞争、热点节点等复杂问题

工作职责

负责 Kubernetes 调度器及调度插件的深度定制,设计面向 AI 工作负载的调度策略(GPU 拓扑感知、NUMA 亲和、网络亲和、RDMA 域感知)

攻克超大规模集群(万卡级)调度性能瓶颈,优化调度吞吐、调度延迟与决策质量,支持每秒数百 Pod 的调度并发
构建异构资源调度体系,实现 GPU/CPU/内存/高速互联网络的多维资源建模与在离线混部,提升集群整体利用率
研发抢占、回填、 gang-scheduling、coscheduling 等高级调度能力,保障大模型训练任务(Job)与推理服务(Service)的 SLO
设计调度仿真与 A/B 测试框架,通过真实负载回放验证调度策略效果,推动调度算法持续迭代

优先资格

Kubernetes/Volcano/YARN/Mesos 等调度系统社区贡献者

有 GPU/NPU 大规模集群调度实际落地经验
具备 eBPF/内核调优及监控经验

AI 洞察

优缺点分析

优点

  • 处于 AI 基础设施核心赛道,技术深度高,长期价值大
  • 能够接触超大规模集群和前沿调度算法,技能积累快
  • 薪资待遇具备竞争力,有期权潜力
  • 工作强度较大,需解决万卡级集群的复杂问题,可能出现高压时段
  • 技术栈较深,要求同时掌握 Go、Kubernetes、调度算法和 GPU 架构,学习曲线陡峭
  • 团队可能较小,需要主动推动和自驱,缺乏成熟指导
  • 适合具备扎实后端基础、对调度系统有浓厚兴趣、愿意深入底层技术的工程师

缺点 / 挑战

  • 公司为 AI 明星创业公司,技术氛围好,有挑战性项目

角色解读

  • 可深入成为 Kubernetes 社区核心贡献者,成为云原生调度领域专家
  • 向 AI 基础设施架构师发展,负责更大规模的集群设计与优化
  • 横向拓展至计算、存储、网络等底层系统方向,或转为技术管理岗位
  • 定制 Kubernetes 调度器插件,实现面向 AI 工作负载的 GPU 拓扑感知、NUMA 亲和等高级调度策略
  • 优化万卡级集群的调度性能,提升每秒调度并发数,降低调度延迟
  • 构建异构资源(GPU/CPU/内存/网络)统一调度模型,实现在离线混部以提升资源利用率
  • 研发抢占、回填、gang-scheduling 等机制,保障大模型训练和推理服务的 SLO
  • 精通 Go 语言,深度掌握 Kubernetes 生态及调度器扩展机制
  • 扎实的调度算法基础,熟悉资源调度、任务调度、负载均衡和装箱优化
  • 理解 GPU 集群架构(NVLink/InfiniBand/RoCE)及 AI 训练/推理的资源需求
  • 具备大规模分布式系统性能优化与问题定位能力

申请策略

  • 面试前准备一个调度算法优化或集群性能问题的案例分析,展示解决思路
  • 了解公司技术栈和产品方向(如 Moonshot AI 的大模型),提前思考可能的业务场景
  • 突出 Go 语言和 Kubernetes 相关项目的经验,最好有调度器或控制器开发经历
  • 展示在分布式系统性能优化方面的成果,比如吞吐提升、延迟降低的具体数据
  • 如果了解 GPU 集群或 AI 任务调度,务必强调
  • 提及任何开源贡献,特别是 Kubernetes 或相关调度系统
  • 系统学习 Kubernetes 调度器源码和调度框架(Scheduling Framework)
  • 补充 GPU 架构知识,了解 NVLink、InfiniBand、CUDA 等内容

面试指南

  • 结构化回答:从问题定义、现有方案、优化思路、落地效果四个层次展开
  • 结合具体案例:用 STAR 法则描述项目背景、任务、行动和结果
  • 展示系统思维:不仅说技术细节,还要考虑扩展性、可维护性和业务影响
  • 请解释 Kubernetes 调度器的整体架构和调度流程
  • 如何设计一个 GPU 拓扑感知的调度策略?
  • 大规模集群中调度吞吐瓶颈可能在哪里?如何优化?
  • 什么是 gang-scheduling?在什么场景下需要?如何实现?
  • 你在之前的项目中如何解决资源竞争或调度死锁问题?

匹配度报告

70
综合匹配度

AI 明星公司,前沿技术栈,核心岗位,薪资较高但工作强度大。

适合人群
最适合看重技术成长和挑战、愿意投入高强度工作的开发者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利75
成长发展90
工作生活30
使命价值85

薪资福利匹配

75中等

薪资水平相对较高,但未明确提及股权或福利细节,中等偏上。

薪资信号未披露(AI估算:30K-50K/月)

成长发展匹配

90较高

技术栈前沿,涉及 AI 基础设施核心难点,成长空间大;JD 未明确晋升通道但技术挑战本身驱动发展。

技术前沿前沿/新兴技术
技术栈Kubernetes、Go、GPU、AI、调度算法、分布式系统、eBPF
业务类型profit_center

工作生活匹配

30较低

仅现场办公,未提及弹性工时或远程,地点核心但可能加班较多。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

85较高

AI 基础设施对行业有重要推动,技术创新性强,社会影响力较高。

行业发展高速增长赛道
社会影响正向社会影响力较高
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

月之暗面 的其他在招职位

  • 机器学习平台工程师(Kubernetes / GPU 基础设施方向)

    月之暗面 · 北京市
    AI 估算 · 35k-55k
  • 海外算力采购经理

    月之暗面 · 北京市
    AI 估算 · 25k-45k
  • 视觉设计实习生(AI Native 方向 / 活动视觉 & 品牌周边)

    月之暗面 · 北京市
    AI 估算 · 4k-6k
  • 业务攻防技术专家

    月之暗面 · 北京市
    AI 估算 · 25k-45k
  • AI产运实习生

    月之暗面 · 上海市
    AI 估算 · 4k-8k

相似职位推荐

  • 服务端测试开发工程师-【品牌营销】

    快手 · 北京市
    AI 估算 · 20k-40k
  • 引擎组长(Warpath) 关键

    莉莉丝 · 上海市
    AI 估算 · 30k-50k
  • TL

    中国平安 · 深圳市
    AI 估算 · 30k-50k
  • 高级蓝牙软件开发工程师-豆包手机助手(北京/深圳)

    字节跳动 · 北京市
    AI 估算 · 30k-55k
  • AI应用后端研发工程师-国际化短视频-深圳/上海

    字节跳动 · 深圳市
    AI 估算 · 25k-45k

月之暗面 的其他在招职位

  • 机器学习平台工程师(Kubernetes / GPU 基础设施方向)

    月之暗面 · 北京市
    AI 估算 · 35k-55k
  • 海外算力采购经理

    月之暗面 · 北京市
    AI 估算 · 25k-45k
  • 视觉设计实习生(AI Native 方向 / 活动视觉 & 品牌周边)

    月之暗面 · 北京市
    AI 估算 · 4k-6k
  • 业务攻防技术专家

    月之暗面 · 北京市
    AI 估算 · 25k-45k
  • AI产运实习生

    月之暗面 · 上海市
    AI 估算 · 4k-8k

相似职位推荐

  • 服务端测试开发工程师-【品牌营销】

    快手 · 北京市
    AI 估算 · 20k-40k
  • 引擎组长(Warpath) 关键

    莉莉丝 · 上海市
    AI 估算 · 30k-50k
  • TL

    中国平安 · 深圳市
    AI 估算 · 30k-50k
  • 高级蓝牙软件开发工程师-豆包手机助手(北京/深圳)

    字节跳动 · 北京市
    AI 估算 · 30k-55k
  • AI应用后端研发工程师-国际化短视频-深圳/上海

    字节跳动 · 深圳市
    AI 估算 · 25k-45k