Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
机器学习系统调度研发工程师-Data AML
立即应聘

机器学习系统调度研发工程师-Data AML

发布于 1 天前

普通员工/个人贡献者

杭州市
高级经验
全职员工
仅现场办公
学历未注明
机器学习
分布式系统
GPU
NLP
GO
RDMA
资源调度
CV

AI 估算 · 30k–50k

字节跳动高级研发岗,杭州薪资略低于北京,但机器学习调度方向技术稀缺,竞争力强,月薪中位数合理。

职位详情

关于这个职位

该职位负责字节跳动机器学习系统资源调度的设计与开发,涉及NLP/CV/Speech等场景的模型训练与推理

你将面对大规模分布式集群,优化GPU、CPU等异构资源的编排,实现稳定、潮汐、混布和多云资源的合理化使用
通过技术手段充分发挥集群计算能力,支持多机房、多地域、多云的负载调度

最低要求

熟练掌握Linux环境下的Go/Python/Shell等1至2种以上语言

熟悉Kubernetes架构和生态,熟悉Docker/Containerd/Kata/Podman等容器技术,有丰富的机器学习系统实践和开发经验
掌握分布式系统原理,参与过分布式系统的设计、开发和维护
有优秀的逻辑分析能力,能够对业务逻辑进行合理的抽象和拆分
有强烈的工作责任心,较好的学习能力、沟通能力和自驱力,能够快速的响应和行动

工作职责

负责机器学习系统资源调度的设计和开发,服务于各方向场景(NLP/CV/Speech等)的模型训练、模型评估和模型推理

负责多种异构资源(GPU、CPU、其他异构硬件)的最优化编排,实现稳定资源、潮汐资源、混布资源、多云资源的合理化使用
负责通过技术手段实现计算资源、RDMA高速网络资源、存储资源的最优调度,充分发挥大规模分布式集群的计算能力
负责多机房、多地域、多云场景的在离线任务/服务调度,实现负载合理化分布

优先资格

加分项:

熟悉至少一种主流的机器学习框架(TensorFlow/PyTorch)
有以下某一方向领域的经验:AI Infrastructure,HW/SW Co-Design,High Performance Computing,ML Hardware Architecture(GPU、Accelerators、Networking)

AI 洞察

优缺点分析

优点

  • 字节跳动平台资源丰富,业务场景多样,能积累一线大厂经验
  • 团队技术氛围浓厚,内部开源和工具链完善,利于个人技术深耕
  • 技术栈要求全面,需要同时掌握分布式、Kubernetes、机器学习等多领域知识
  • 系统复杂性高,排查问题需要较强的逻辑分析和持久攻坚能力
  • 适合对大规模分布式系统和高性能计算有浓厚兴趣,愿意深入底层调度技术,并能适应高强度工作节奏的技术型人才

缺点 / 挑战

  • 接触超大规模分布式集群和前沿AI技术,技术挑战大,成长空间广阔
  • 工作强度较高,需要快速响应线上问题,可能涉及值班或紧急修复

角色解读

  • 向机器学习基础设施专家或架构师方向发展,负责更大规模的集群调度系统
  • 横向拓展至AI平台整体架构,参与训练框架、推理引擎、数据管道等核心组件
  • 在字节跳动内部可转向技术管理岗位,带领团队突破资源调度瓶颈
  • 设计和开发机器学习系统的资源调度模块,支持NLP、CV、Speech等模型的训练和推理
  • 优化GPU、CPU等异构资源的编排与分配,实现稳定、潮汐、混布、多云资源的合理利用
  • 通过调度算法提升大规模分布式集群的计算效率,管理多机房、多地域的负载分布
  • 精通Go/Python等语言,具备扎实的Linux开发能力
  • 深入理解Kubernetes生态及容器技术,有丰富的机器学习系统实践经验
  • 掌握分布式系统原理,参与过分布式调度或资源管理系统的开发

申请策略

  • 提前了解字节跳动AML团队的技术博客和开源项目,面试时展现对调度领域的深入思考
  • 准备一个完整的大规模资源调度案例,从设计到落地的全流程复盘
  • 突出Kubernetes、Docker等容器编排项目的实际经验,包括集群规模、调度优化等量化成果
  • 强调分布式系统设计或参与过的资源调度系统,说明具体贡献和难点解决
  • 展示机器学习相关项目经历,特别是训练/推理场景下的工程实践
  • 补充学习Linux内核调度、CGroup、网络性能调优等底层知识
  • 熟悉TensorFlow/PyTorch分布式训练原理,了解Horovod或DeepSpeed等框架

面试指南

  • 从问题定义、目标约束、方案设计、权衡分析、工程实现五步法展开回答
  • 结合具体业务场景,先给出通用思路再细化技术选型,突出可落地性
  • 适当引用业界实践(如阿里Sigma、Google Borg)并对比字节内部特点
  • 如何设计一个支持多种资源的Kubernetes调度器?
  • 解释GPU显存调度和任务排队的策略,如何避免资源碎片?
  • 描述你解决过的分布式系统资源竞争或死锁问题
  • Kubernetes中如何实现混部(在线和离线任务)的资源隔离?
  • 面对突发流量,如何保证模型推理服务的资源快速扩缩?

匹配度报告

68
综合匹配度

字节跳动AML高级调度研发岗,前沿技术栈、高成长性,但工作强度大、WLB一般。

适合人群
该职位最适合追求技术深度和快速成长的求职者,愿意在高强度环境中挑战前沿技术。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利75
成长发展90
工作生活45
使命价值60

薪资福利匹配

75中等

字节跳动薪资在行业内具有竞争力,且作为上市公司福利体系完善,但具体薪资需面议,补偿性动机满足程度较好。

薪资信号未披露(AI估算:30K-50K/月)

成长发展匹配

90较高

该岗位涉及前沿的AI基础设施、大规模分布式系统,技术挑战高,成长空间极大,发展性动机满足程度很高。

技术前沿前沿/新兴技术
技术栈Kubernetes、Docker、GPU、RDMA、分布式调度、机器学习
业务类型profit_center

工作生活匹配

45较低

字节跳动整体工作节奏较快,该岗位涉及线上服务调度,可能需要应对紧急问题,生活化动机满足程度较低。

工作模式仅现场办公
办公地点未明确
加班情况明确要求弹性/高强度

使命价值匹配

60中等

该岗位通过优化资源调度提升AI计算效率,间接推动技术发展,但社会价值导向不明显,意义感满足程度中等。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • AI平台研发工程师-集团信息系统

    字节跳动 · 深圳市
    AI 估算 · 25k-45k
  • 国际业务内容商务拓展专家-Dola

    字节跳动 · 北京市
    AI 估算 · 35k-65k
  • 商业化营销策略专家-抖音生活服务

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • HRBP-中国公共职能(北京)

    字节跳动 · 北京市
    AI 估算 · 20k-30k
  • 产品经理(导航/路线/路况)-地理位置中台

    字节跳动 · 北京市
    AI 估算 · 25k-40k

相似职位推荐

  • Java开发工程师(联盟) - 【商业化】

    快手 · 北京市
    AI 估算 · 18k-28k
  • 后端AI Agent 工程师

    中国平安 · 深圳市
    AI 估算 · 20k-40k

字节跳动 的其他在招职位

  • AI平台研发工程师-集团信息系统

    字节跳动 · 深圳市
    AI 估算 · 25k-45k
  • 国际业务内容商务拓展专家-Dola

    字节跳动 · 北京市
    AI 估算 · 35k-65k
  • 商业化营销策略专家-抖音生活服务

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • HRBP-中国公共职能(北京)

    字节跳动 · 北京市
    AI 估算 · 20k-30k
  • 产品经理(导航/路线/路况)-地理位置中台

    字节跳动 · 北京市
    AI 估算 · 25k-40k

相似职位推荐

  • Java开发工程师(联盟) - 【商业化】

    快手 · 北京市
    AI 估算 · 18k-28k
  • 后端AI Agent 工程师

    中国平安 · 深圳市
    AI 估算 · 20k-40k