Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业定价
我的收藏免费试用登录注册

Meituan logo
美团
机器学习资源调度系统工程师
立即应聘

机器学习资源调度系统工程师

发布于 大约 2 个月前

普通员工/个人贡献者

北京市
中级经验
全职员工
仅现场办公
学历未注明
软件工程
GPU
GO
AI基础设施
分布式训练
资源调度
云原生

AI 估算 · 25k–45k

北京互联网大厂中级工程师,涉及AI基础设施和云原生核心技术,薪资具有竞争力。

职位详情

关于这个职位

该职位负责美团机器学习平台的资源调度系统设计与优化,涉及大规模算力集群的构建与维护,以及训练任务调度策略的优化

你将与算法和工程团队紧密合作,通过全栈可观测体系和自动化运维工具提升集群资源利用率
适合对AI基础设施有热情、具备扎实系统能力的技术人才

最低要求

计算机基础扎实,熟练掌握Go、Python或Java至少一种编程语言

年以上软件开发或系统架构经验,有大规模集群管理经验者优先
熟悉Kubernetes、Containerd、Docker等云原生核心技术栈和云原生开发模式
具备良好的系统设计与问题排查能力,有机器学习平台开发经验者优先

工作职责

负责机器学习平台的资源调度系统设计与优化,提升集群资源利用率

构建和维护大规模算力集群,支撑大规模分布式训练、推理等多样化 AI 工作负载,保障高可用与高性能运行
与算法和工程团队协作,优化训练任务调度策略,针对 GPU 计算、显存、互联带宽等关键路径进行性能调优,降低训练成本与时间
建设覆盖硬件、驱动、调度链路的全栈可观测体系,基于监控数据驱动资源优化与容量预测决策
开发自动化运维工具,实现任务调度、监控告警与故障自愈能力
跟踪业界前沿技术,持续改进集群管理与调度架构

优先资格

大规模集群管理经验

机器学习平台开发经验

AI 洞察

优缺点分析

优点

  • 有机会接触美团海量数据和业务场景,技术视野开阔,成长空间大
  • 公司平台与团队技术氛围浓厚,有完善的互联网学习生态圈,助力职业发展
  • 涉及从驱动到调度层的全栈技术,学习曲线较陡,需要较强的系统理解能力
  • 技术迭代快,需要持续跟踪前沿技术,保持学习状态

缺点 / 挑战

  • 参与建设高复杂度、超大规模算力的AI基础设施平台,技术挑战大,有利于积累分布式系统和AI工程化经验
  • 大规模集群运维和优化工作可能面临高强度和压力,需要快速响应和解决问题
  • 适合对AI基础设施和云原生技术有浓厚兴趣,具备扎实系统能力,愿意深入底层并接受挑战的工程师

角色解读

  • 从资源调度工程师向AI基础设施架构师发展,深入系统各层(内核、容器、调度)提升全栈能力
  • 横向扩展至AI平台的其他模块,如训练框架优化、推理引擎等,成为AI基础设施领域专家
  • 纵向晋升为技术专家或技术管理,带领团队打造行业领先的AI基础设施
  • 参与美团机器学习平台的资源调度系统设计,优化集群资源利用率,支撑大规模AI训练与推理
  • 构建和维护大规模GPU集群,保障高可用与高性能,与算法团队协作优化调度策略
  • 建设全栈可观测体系,基于监控数据驱动资源优化与容量预测,开发自动化运维工具
  • 扎实的编程基础,熟练掌握Go、Python或Java,熟悉云原生技术栈如Kubernetes、Docker
  • 具备大规模集群管理经验,熟悉GPU计算、分布式训练相关技术
  • 良好的系统设计与问题排查能力,有机器学习平台开发经验者优先

申请策略

  • 关注美团的AI基础设施技术博客或开源项目,了解团队技术栈和方向
  • 在简历和面试中强调对系统稳定性和资源效率的理解,体现工程思维
  • 突出大规模集群管理或分布式系统相关项目经验,尤其是Kubernetes、Docker等云原生技术实践
  • 强调在GPU计算、资源调度或性能优化方面的具体成果,用数据体现提升效果
  • 展示编程能力(Go/Python)和系统设计能力,最好有开源贡献或技术博客
  • 深入学习Kubernetes调度原理和源码,理解其工作机制和扩展方式
  • 补充GPU计算和分布式训练相关知识,了解常见框架(如PyTorch、TensorFlow)的分布式训练策略

面试指南

  • 对于调度优化问题,可以从现状分析、瓶颈定位、优化方案(如优先级调度、资源预占、碎片整理等)、效果量化四个步骤回答
  • 对于系统设计问题,可以采用需求分析、架构设计、关键组件、权衡取舍、评估指标的结构
  • 请描述你参与过的一个大规模集群调度系统,如何优化资源利用率?
  • Kubernetes中调度器的工作原理是什么?如何实现自定义调度策略?
  • 在分布式训练中,如何平衡GPU计算、显存和网络带宽?遇到过什么瓶颈?
  • 如何设计一个可观测性系统来监控集群健康状态并驱动容量规划?
  • 假设集群出现大量GPU利用率低下,如何排查并解决?
  • 复习Kubernetes调度器和资源管理相关概念(如LimitRange、ResourceQuota、Pod优先级与抢占)

匹配度报告

72
综合匹配度

美团大厂,前沿AI基础设施岗,技术成长快,薪资可观,但加班可能较多。

适合人群
适合追求技术成长、渴望接触前沿AI基础设施和分布式系统的工程师,对工作生活平衡要求不高者更佳。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利80
成长发展90
工作生活50
使命价值70

薪资福利匹配

80较高

美团的薪资福利在互联网行业中属于第一梯队,但JD未明确薪资和具体福利。考虑到公司规模和职位级别,薪资预期较高,稳定性好。

薪资信号未披露(AI估算:25K-45K/月)

成长发展匹配

90较高

JD明确提到参与前沿技术研发、接触超规模集群、有完善的互联网学习生态圈,技术成长空间极大,且团队技术氛围浓厚。

技术前沿前沿/新兴技术
技术栈Kubernetes、Docker、GPU、分布式训练、云原生
成长机会完善的互联网学习生态圈、技术成长空间大
业务类型ambiguous

工作生活匹配

50较低

JD未提及工作生活平衡相关信息,工作地点在北京,互联网大厂通常加班较多,但未明确说明。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

70中等

该职位参与AI基础设施建设,属于技术前沿,行业前景好,但社会影响力中性,主要以技术驱动为主。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

美团 的其他在招职位

  • 内容营销实习生

    美团 · 北京市
    AI 估算 · 4k-6k
  • 餐饮SaaS高级测试开发工程师

    美团 · 北京市
    AI 估算 · 25k-45k
  • 鲜肉自营采购-鲜牛羊

    美团 · 北京市
    AI 估算 · 25k-40k
  • 美团酒店旅行-交通财务BP

    美团 · 北京市
    AI 估算 · 25k-45k
  • PC加工专家

    美团 · 北京市
    AI 估算 · 25k-40k

相似职位推荐

  • 辅助驾驶HMI后处理研发工程师-2027届

    小米 · 北京市
    AI 估算 · 4k-6k
  • 服务端高级研发工程师

    小米 · 武汉市
    AI 估算 · 25k-40k
  • 高级语音测试开发工程师

    小米 · 北京市
    AI 估算 · 30k-45k
  • 微信-基础功能后台开发

    腾讯 · 广州市
    AI 估算 · 20k-35k
  • 微信-AI应用开发工程师

    腾讯 · 广州市
    AI 估算 · 20k-40k

美团 的其他在招职位

  • 内容营销实习生

    美团 · 北京市
    AI 估算 · 4k-6k
  • 餐饮SaaS高级测试开发工程师

    美团 · 北京市
    AI 估算 · 25k-45k
  • 鲜肉自营采购-鲜牛羊

    美团 · 北京市
    AI 估算 · 25k-40k
  • 美团酒店旅行-交通财务BP

    美团 · 北京市
    AI 估算 · 25k-45k
  • PC加工专家

    美团 · 北京市
    AI 估算 · 25k-40k

相似职位推荐

  • 辅助驾驶HMI后处理研发工程师-2027届

    小米 · 北京市
    AI 估算 · 4k-6k
  • 服务端高级研发工程师

    小米 · 武汉市
    AI 估算 · 25k-40k
  • 高级语音测试开发工程师

    小米 · 北京市
    AI 估算 · 30k-45k
  • 微信-基础功能后台开发

    腾讯 · 广州市
    AI 估算 · 20k-35k
  • 微信-AI应用开发工程师

    腾讯 · 广州市
    AI 估算 · 20k-40k