Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
AML 机器学习推理框架研发工程师
立即应聘

AML 机器学习推理框架研发工程师

发布于 大约 17 小时前

普通员工/个人贡献者

上海市
中级经验
全职员工
仅现场办公
学历未注明
GPU
深度学习
PyTorch
计算机视觉
TensorFlow
CUDA
模型优化
推理框架

AI 估算 · 35k–60k

大厂AI核心岗位,技术难度高,市场薪资竞争力强,中位数约47.5K/月。

职位详情

关于这个职位

该职位负责字节跳动AML机器学习在线服务框架的研发,支持公司各产品线的模型部署与优化

你将与算法团队深度合作,从系统和架构层面提升模型推理性能,涉及C++、Python、TensorFlow/PyTorch等主流框架
适合对高性能计算和深度学习推理有热情的工程师

最低要求

熟练掌握Linux环境下的C/C++、Python语言

具备扎实的计算机科学功底和编程能力,熟悉常见算法和数据结构,具有良好的编程习惯
能够熟练使用至少一种主流的机器学习框架(TensorFlow/PyTorch等),熟悉框架内部实现
熟悉至少一种经典深度学习模型及其应用场景,如ResNet、BERT等
有良好的工作文档习惯,及时按要求撰写更新工作流程及技术文档

工作职责

负责字节跳动AML机器学习在线服务框架的研究与开发,服务于公司各个产品

高效部署,优化计算机视觉、语音识别、语音合成、自然语言处理等字节跳动核心业务模型
与公司各算法部门深度合作,分析业务性能瓶颈和系统架构特征,软硬件结合优化,实现极致性能

优先资格

对深度学习训练和推理模型调试、调优有实操经验

理解GPU硬件架构,理解GPU软件栈(CUDA,cuDNN),具备GPU性能分析的经验
熟悉各类深度学习网络和算子底层实现细节
熟悉并行计算算法,擅长各类并行编程
熟悉模型剪枝、量化等优化方法
熟悉TVM、MLIR、XLA等模型优化工具
了解GAN,强化学习,图神经网络,AutoML等

AI 洞察

优缺点分析

  • 参与核心AI基础设施建设,技术影响力大
  • 接触前沿的模型优化技术(量化、剪枝、TVM等),技能成长快
  • 字节跳动国际化平台,职业发展空间广阔
  • 技术深度要求高,需要同时掌握系统和深度学习知识
  • 业务压力大,模型上线节奏快,需要快速解决问题
  • 竞争激烈,需持续学习新技术
  • 适合对高性能计算和深度学习推理有浓厚兴趣,喜欢挑战和解决复杂系统问题的工程师

角色解读

  • 向AI系统架构师方向发展,成为模型部署与优化领域专家
  • 可转型为算法工程师,深入理解模型设计与训练
  • 在字节跳动内部有良好的晋升通道,可向技术管理岗发展
  • 设计和开发高性能的机器学习推理框架,优化模型部署和推理速度
  • 与算法团队协作,针对视觉、语音、NLP等模型进行性能分析与调优
  • 软硬件协同优化,利用GPU等硬件特性提升推理效率
  • 精通C/C++和Python,具备系统编程能力和计算机基础
  • 深入理解至少一种深度学习框架(TensorFlow/PyTorch)内部机制
  • 熟悉经典模型结构(ResNet、BERT等)和推理优化技术

申请策略

  • 了解字节跳动AML团队的技术博客和开源项目,展现主动学习能力
  • 准备一个端到端的推理优化案例,体现解决实际问题的能力
  • 突出在深度学习框架或推理引擎上的开发经历
  • 强调性能优化项目(如模型加速、GPU调优)的具体成果
  • 展示对底层系统(CUDA、多线程、内存管理)的理解
  • 系统学习CUDA编程和GPU架构
  • 实践模型压缩和量化工具(TensorRT、TVM)

面试指南

  • 对于原理性问题,先讲核心概念再结合实际场景
  • 对于优化问题,采用“分析瓶颈-提出方案-验证效果”的框架
  • 准备技术深度和广度兼顾的案例
  • 请解释TensorFlow/PyTorch的静态图和动态图的区别及优缺点
  • 如何优化一个BERT模型的推理速度?
  • 介绍一下GPU内存管理和算子融合技术
  • 描述一次你解决深层系统性能瓶颈的经历
  • 复习深度学习框架源码(如PyTorch的JIT、TensorFlow的XLA)

匹配度报告

76
综合匹配度

字节跳动AI推理框架岗,技术前沿,薪资优厚,但工作强度和竞争压力较大。

适合人群
适合追求技术成长和高薪酬的求职者,能接受一定工作强度。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展92
工作生活45
使命价值80

薪资福利匹配

85较高

字节跳动作为上市大厂,薪酬待遇在行业内具有竞争力,但具体薪资未在JD中披露。

薪资信号未披露 (35K-60K/月)

成长发展匹配

92较高

该职位涉及前沿的AI推理优化技术,能深度参与核心业务,技能成长空间极大。

技术前沿前沿/新兴技术
技术栈C++、Python、TensorFlow、PyTorch、GPU、CUDA、模型优化
业务类型profit_center

工作生活匹配

45较低

工作地点在上海,但未提及灵活办公,互联网公司通常加班较多,生活平衡方面挑战较大。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值匹配

80较高

参与AI基础设施建设,技术前沿,但对社会直接影响不明显。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 游戏关卡策划-绿洲

    字节跳动 · 北京市
    AI 估算 · 20k-40k
  • Android开发工程师-今日头条

    字节跳动 · 北京市
    AI 估算 · 20k-40k
  • AI/大模型网络研发工程师

    字节跳动 · 深圳市
    AI 估算 · 30k-60k
  • 抖音直播服务端核心研发工程师-游戏商业化方向

    字节跳动 · 广州市
    AI 估算 · 25k-45k
  • 大模型Agent研究工程师-Seed

    字节跳动 · 上海市
    AI 估算 · 30k-60k

相似职位推荐

  • Engineer

    友邦保险 · 上海市
    AI 估算 · 12k-18k
  • Engineer

    友邦保险 · CN-M Plaza
    AI 估算 · 15k-25k
  • Engineer

    友邦保险 · CN-M Plaza
    AI 估算 · 15k-25k

字节跳动 的其他在招职位

  • 游戏关卡策划-绿洲

    字节跳动 · 北京市
    AI 估算 · 20k-40k
  • Android开发工程师-今日头条

    字节跳动 · 北京市
    AI 估算 · 20k-40k
  • AI/大模型网络研发工程师

    字节跳动 · 深圳市
    AI 估算 · 30k-60k
  • 抖音直播服务端核心研发工程师-游戏商业化方向

    字节跳动 · 广州市
    AI 估算 · 25k-45k
  • 大模型Agent研究工程师-Seed

    字节跳动 · 上海市
    AI 估算 · 30k-60k

相似职位推荐

  • Engineer

    友邦保险 · 上海市
    AI 估算 · 12k-18k
  • Engineer

    友邦保险 · CN-M Plaza
    AI 估算 · 15k-25k
  • Engineer

    友邦保险 · CN-M Plaza
    AI 估算 · 15k-25k