Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

ByteDance logo
字节跳动
AML-机器学习系统研发工程师
立即应聘

AML-机器学习系统研发工程师

发布于 大约 11 小时前

普通员工/个人贡献者

上海市
高级经验
全职员工
仅现场办公
学历未注明
软件工程
深度学习
GPU优化
CUDA
NCCL
分布式训练
AI编译器
大模型
高性能计算(Hpc)

AI 估算 · 25k–50k

大厂高级算法岗,技术栈前沿,市场稀缺,薪资竞争力强

职位详情

关于这个职位

作为字节跳动AML团队的机器学习系统研发工程师,你将参与火山引擎机器学习训练和推理框架的研发与优化,支撑抖音、今日头条等核心业务的推荐、广告、CV、语音、NLP等系统

工作覆盖资源调度、任务编排、模型训练与推理、大模型分布式训练与优化、AI+HPC等领域,需要深入探索前沿技术并解决高并发、高可靠性的工程挑战
该岗位技术含量高,对系统能力和算法功底要求严格,适合希望在机器学习系统方向深入发展的技术人才

最低要求

有C/C++/Python/Cuda开发经验,熟练使用Linux 系统/ GDB /Nsight等工具,ACM/ICPC/Codeforces等获奖者优先

能够从产品思维、机器性能和稳定性、团队协作等多种视角,高标准要求自己的技术方案和每一行代码
对如下一个或多个领域有经验,或者无经验但有浓厚的兴趣(须额外付出自己的时间进行深入研究和探索):
a. 大模型系统:基础模型的分布式训练(Scaling Laws)、高效微调(Lora/P-Tuning/RLHF)、推理引擎和优化(并行策略、量化压缩、算子优化等)、Transformer模型结构(Sparse/MoE/LongContext等)
b. AI+HPC:并行计算(CPU/Cuda/OpenCL)、通信(NCCL/MPI/RDMA/DPDK)、AI编译器(MLIR/TVM/Trition/LLVM)、Linux OS及Kernel
c. 机器学习算法:各类基于梯度的经典算法与经典模型(ResNet/BERT/GPT/Swin Transformer/MLP-Mixer)、多模态(CLIP/BLIP/miniGPT4)

工作职责

负责火山引擎机器学习训练和推理框架的研发和性能优化,支撑火山引擎机器学习平台和方舟大模型平台的相关需求和架构迭代

负责解决系统高并发、高可靠性、高可扩展性等技术难关
覆盖机器学习系统多个子方向领域的工作,包括:资源调度、任务编排、模型训练、模型推理、模型管理、数据集管理、工作流编排、ML for System等
负责机器学习系统前瞻技术的调研和引入,比如:最新硬件架构、异构计算系统、GPU 优化技术的引入落地
研究基于机器学习方法,实现对集群/服务资源使用情况的分析和优化

AI 洞察

优缺点分析

优点

  • 顶级大厂平台,参与核心机器学习中台建设,技术影响力大
  • 技术栈前沿,覆盖大模型、HPC、AI编译器等多个热门领域,个人成长迅速
  • 薪资福利优厚,股票期权等长期激励
  • 团队技术氛围浓厚,与业界顶尖工程师合作
  • 工作强度较大,需要持续学习跟上技术迭代,对自驱力要求高
  • 问题复杂度高,需要扎实的系统底层能力和算法功底
  • 技术方案需要兼顾性能、稳定性和业务需求,决策难度大
  • 适合对机器学习系统有浓厚兴趣、追求技术深度、能承受高强度工作并渴望在大平台快速成长的技术人才

缺点 / 挑战

暂无明显挑战项

角色解读

  • 技术深度发展:成为分布式训练、推理优化或AI编译器领域的专家
  • 架构师方向:主导机器学习系统的整体架构设计和关键技术决策
  • 跨领域拓展:结合业务场景,转向推荐系统、CV/NLP算法或AI for Science等前沿方向
  • 负责火山引擎机器学习训练和推理框架的研发与性能优化,解决高并发、高可靠性等技术难题
  • 覆盖资源调度、任务编排、模型训练与推理、模型管理等系统子方向,推动架构迭代
  • 调研并引入最新硬件架构、异构计算和GPU优化技术,提升系统效率
  • 研究基于机器学习的方法进行集群资源分析与优化
  • 精通C/C++/Python/CUDA,熟练使用Linux系统及GDB/Nsight等调试工具
  • 具备产品思维,能从性能、稳定性和团队协作视角高标准要求技术方案
  • 对大模型系统(分布式训练、高效微调、推理优化)或AI+HPC(并行计算、通信、AI编译器)或经典机器学习算法有深入经验或强烈兴趣

申请策略

  • 提前了解火山引擎机器学习平台和方舟大模型平台的产品特点,思考如何改进
  • 准备1-2个自己主导的技术项目,详细描述架构设计、优化方法和成果
  • 突出C++/Python/CUDA项目经验,尤其是高性能计算或分布式系统相关经历
  • 强调在大模型训练/推理、AI编译器或GPU优化方面的实际成果(如性能提升数据)
  • 展示竞赛获奖(如ACM/ICPC)或开源贡献,体现技术实力
  • 描述在复杂系统中解决高并发、高可靠性问题的案例
  • 系统学习CUDA编程与GPU优化技术,动手实现算子优化
  • 深入了解分布式训练框架(如DeepSpeed、Megatron)和推理引擎(如vLLM、TensorRT-LLM)

面试指南

  • 对于技术原理题,先定义概念,再对比不同方案的优缺点,最后结合实践举例
  • 对于优化类问题,采用“问题定位-方案对比-实施效果”的STAR结构,量化结果
  • 对于系统设计题,从需求分析、架构分层、关键难点、容错机制等角度展开
  • 请解释大规模分布式训练中数据并行和模型并行的区别及适用场景
  • 如何优化一个Transformer模型的推理速度?请从算子融合、量化、并行策略等方面阐述
  • 描述一次你解决系统性能瓶颈的经历,使用了哪些工具和方法?
  • 你对AI编译器(如TVM/MLIR)的理解是什么?它们如何提升模型部署效率?
  • 在资源调度系统中,如何保证高可用性和任务公平性?

职位点评

74
综合评分

技术前沿、薪资优厚,但工作强度大,适合热衷技术的奋斗型人才。

更适合这类人
最适合追求技术成长和薪资回报的求职者,愿意接受较高工作强度。
表现最好
成长发展
相对薄弱
工作生活
薪资福利85
成长发展95
工作生活35
使命价值80

薪资福利

85较高

字节跳动薪资在行业内具有竞争力,但JD未明确具体薪酬范围,需面试确认。公司福利完善,但JD未列出,故不做推断。

薪资信号未披露(AI估算:25K-50K/月)

成长发展

95较高

该岗位技术栈前沿,覆盖大模型、HPC、AI编译器等多个高速发展领域,成长空间极大。但JD中未明确提及内部培训或晋升通道。

技术前沿前沿/新兴技术
技术栈大模型、分布式训练、AI编译器、GPU优化、HPC、NCCL、MLIR、TVM
业务类型profit_center

工作生活

35较低

岗位要求上海现场办公,JD未提及弹性工作或WLB。字节跳动通常工作强度较高,但需面试确认。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值

80较高

机器学习中台支持公司核心业务并对外赋能火山引擎,行业处于高速增长期,技术创新性强,但社会影响力相对中性。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 多媒体处理高级开发工程师

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 招聘专家-广告

    字节跳动 · 北京市
    AI 估算 · 20k-35k
  • 自动化开发专家-TikTok(杭州/上海)

    字节跳动 · 杭州市
    AI 估算 · 35k-65k
  • AI业务研发工程师-TikTok Shop

    字节跳动 · 上海市
    AI 估算 · 25k-50k
  • 平台产品经理(游戏AI方向)-抖音

    字节跳动 · 深圳市
    AI 估算 · 25k-45k

相似职位推荐

  • Student Intern-SYNC

    西门子 · 上海市
    AI 估算 · 4k-6k
  • Advanced Software Engineer-C++

    飞利浦 · 沈阳市
    AI 估算 · 15k-25k
  • Advanced Software Engineer-C++

    飞利浦 · 沈阳市
    AI 估算 · 25k-40k
  • 2027 Campus - Software Development Engineer - Industrial & IoT

    恩智浦半导体 · 北京市
    AI 估算 · 15k-25k
  • 大模型推理部署优化实习生-AI引擎

    米哈游 · 上海市
    AI 估算 · 4k-8k

字节跳动 的其他在招职位

  • 多媒体处理高级开发工程师

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 招聘专家-广告

    字节跳动 · 北京市
    AI 估算 · 20k-35k
  • 自动化开发专家-TikTok(杭州/上海)

    字节跳动 · 杭州市
    AI 估算 · 35k-65k
  • AI业务研发工程师-TikTok Shop

    字节跳动 · 上海市
    AI 估算 · 25k-50k
  • 平台产品经理(游戏AI方向)-抖音

    字节跳动 · 深圳市
    AI 估算 · 25k-45k

相似职位推荐

  • Student Intern-SYNC

    西门子 · 上海市
    AI 估算 · 4k-6k
  • Advanced Software Engineer-C++

    飞利浦 · 沈阳市
    AI 估算 · 15k-25k
  • Advanced Software Engineer-C++

    飞利浦 · 沈阳市
    AI 估算 · 25k-40k
  • 2027 Campus - Software Development Engineer - Industrial & IoT

    恩智浦半导体 · 北京市
    AI 估算 · 15k-25k
  • 大模型推理部署优化实习生-AI引擎

    米哈游 · 上海市
    AI 估算 · 4k-8k