Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
AML 机器学习推理框架研发工程师
立即应聘

AML 机器学习推理框架研发工程师

发布于 大约 10 小时前

普通员工/个人贡献者

北京市
中级经验
全职员工
仅现场办公
学历未注明
机器学习
GPU
深度学习
PyTorch
计算机视觉
TensorFlow
CUDA
推理框架

AI 估算 · 30k–60k

字节跳动大厂,前沿AI方向,要求高,薪资竞争力强,参考市场水平。

职位详情

关于这个职位

该职位是字节跳动AML中台的机器学习推理框架研发工程师,负责开发和优化在线服务框架,部署计算机视觉、语音识别、NLP等核心模型,并与算法团队深度合作,通过软硬件结合实现极致性能

适合对深度学习推理和系统优化有热情的技术人才

最低要求

熟练掌握Linux环境下的C/C++、Python语言

具备扎实的计算机科学功底和编程能力,熟悉常见算法和数据结构,具有良好的编程习惯
能够熟练使用至少一种主流的机器学习框架(TensorFlow / PyTorch等),熟悉框架内部实现
熟悉至少一种经典深度学习模型及其应用场景,如ResNet、BERT等
有良好的工作文档习惯,及时按要求撰写更新工作流程及技术文档

工作职责

负责字节跳动 AML 机器学习在线服务框架的研究与开发,服务于公司各个产品

高效部署,优化计算机视觉、语音识别、语音合成、自然语言处理等字节跳动核心业务模型
与公司各算法部门深度合作,分析业务性能瓶颈和系统架构特征,软硬件结合优化,实现极致性能

优先资格

对深度学习训练和推理模型调试、调优有实操经验

理解 GPU硬件架构,理解 GPU 软件栈(CUDA,cuDNN),具备 GPU 性能分析的经验
熟悉各类深度学习网络和算子底层实现细节
熟悉并行计算算法,擅长各类并行编程
熟悉模型剪枝、量化等优化方法
熟悉 TVM、MLIR、XLA 等模型优化工具
了解 GAN,强化学习,图神经网络,AutoML等

AI 洞察

优缺点分析

优点

  • 团队技术氛围浓厚,在GPU优化、编译器等领域有业界前沿实践
  • 字节跳动平台资源丰富,有机会接触多元业务和顶尖算法团队
  • 技术栈复杂,需要持续学习系统、算法和硬件多领域知识
  • 竞争激烈,需要不断产出高影响力的优化成果
  • 适合对系统性能优化有浓厚兴趣、热爱钻研底层技术、能承受高强度工作的技术人才

缺点 / 挑战

  • 参与千万级QPS的推理系统开发,技术挑战大,成长迅速
  • 工作强度较高,可能需要应对突发线上问题和快速迭代

角色解读

  • 从单模型优化到整个推理系统的架构设计,成为系统性能专家
  • 深入底层硬件和编译器技术,转型为AI Infra或芯片软件栈方向
  • 积累业务场景经验后,可转向算法研究或技术管理岗位
  • 研发和维护字节跳动的机器学习在线服务框架,支持海量请求的低延迟推理
  • 针对计算机视觉、语音、NLP等模型进行部署优化,包括算子融合、量化等
  • 与算法团队协作,分析性能瓶颈,利用GPU和系统架构特点进行软硬件联合优化
  • 精通C++和Python,具备扎实的计算机科学基础和算法能力
  • 熟练使用TensorFlow或PyTorch,理解框架内部机制
  • 了解经典深度学习模型(如ResNet、BERT)的原理和应用
  • 加分:GPU编程(CUDA)、模型优化工具(TVM、MLIR)及并行计算经验

申请策略

  • 了解字节跳动AML团队的技术博客或开源项目,在面试中展示共鸣
  • 准备一个端到端的模型优化案例,从推理延迟到吞吐量,体现系统思维
  • 突出C++/Python项目经验,尤其是高性能计算或框架二次开发经历
  • 展示深度学习模型部署或优化的具体案例,包括性能提升数据
  • 如有GPU编程或编译器相关经验,务必详细描述
  • 强调对框架内部实现的理解,比如看过PyTorch源码等
  • 学习CUDA和GPU架构,动手编写简单kernel
  • 熟悉TVM或MLIR的基本用法,了解模型编译优化流程

面试指南

  • 从系统角度分层次:算法层(剪枝、量化)、框架层(算子融合、图优化)、硬件层(kernel调优、内存布局)
  • 对比方法时,先定义指标(延迟、吞吐),再分析优缺点,最后给出场景推荐
  • 问题排查类:先定位瓶颈(CPU/GPU/IO),再用工具(NVIDIA Nsight、perf)分析,最后给出优化方案
  • 如何优化一个PyTorch模型在GPU上的推理速度?请列举具体方法
  • 解释TensorFlow与PyTorch的图执行模式差异及其对性能的影响
  • CUDA中的warp divergence是什么?如何避免?
  • 描述一下模型量化的工作原理,以及你可能遇到的精度问题
  • 如何排查线上推理服务的内存泄漏或性能抖动问题?

匹配度报告

66
综合匹配度

字节跳动AML,前沿AI推理框架,高薪高成长,但工作强度大。

适合人群
最适合追求技术深度和快速成长,同时能够接受高强度工作的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利70
成长发展85
工作生活40
使命价值70

薪资福利匹配

70中等

字节跳动薪资有竞争力,但JD未披露具体数字和福利,因此补偿性动机满足程度中等偏上。

薪资信号未披露(AI估算:30K-60K/月)

成长发展匹配

85较高

技术前沿(GPU优化、推理框架),与大牛共事,成长空间大,但未明确提及晋升路径。

技术前沿前沿/新兴技术
技术栈C++、Python、TensorFlow、PyTorch、CUDA、GPU、深度学习、模型优化、TVM、MLIR
业务类型profit_center

工作生活匹配

40较低

仅现场办公,未提及弹性工作,字节工作强度普遍较大,WLB信号缺失。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值匹配

70中等

AI行业高速增长,工作内容对社会有间接影响(服务海量用户),但无直接社会使命感。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 消息中间件产品开发工程师

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 番茄系内容运营-音乐

    字节跳动 · 北京市
    AI 估算 · 15k-30k
  • 基础框架产品-红果短剧

    字节跳动 · 深圳市
    AI 估算 · 20k-35k
  • XR系统应用开发工程师-移动OS

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • UX设计师-飞书文档

    字节跳动 · 深圳市
    AI 估算 · 15k-30k

字节跳动 的其他在招职位

  • 消息中间件产品开发工程师

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 番茄系内容运营-音乐

    字节跳动 · 北京市
    AI 估算 · 15k-30k
  • 基础框架产品-红果短剧

    字节跳动 · 深圳市
    AI 估算 · 20k-35k
  • XR系统应用开发工程师-移动OS

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • UX设计师-飞书文档

    字节跳动 · 深圳市
    AI 估算 · 15k-30k