Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

ByteDance logo
字节跳动
公有云机器学习系统工程师-推理方向
立即应聘

公有云机器学习系统工程师-推理方向

发布于 大约 11 小时前

普通员工/个人贡献者

北京市
高级经验
全职员工
仅现场办公
学历未注明
软件工程
分布式系统
GPU
PyTorch
GO
TensorFlow
推理优化
云原生

AI 估算 · 30k–60k

一线大厂核心岗位,要求高技能栈,薪资竞争力强。

职位详情

关于这个职位

作为字节跳动的公有云机器学习系统工程师(推理方向),你将负责设计开发支撑火山方舟大模型平台的推理架构与产品,构建高并发、高吞吐的大规模在线推理系统,并推动推理产品的公有云化落地,是打造一流AI基础设施的核心角色

最低要求

熟练掌握Linux环境下的Go/Java/Python等1-2种语言

具备扎实的计算机科学功底和编程能力,熟悉常见算法和数据结构,具有良好的编程习惯
熟悉至少一种主流的机器学习框架(TensorFlow / PyTorch 或其他自研框架)
熟悉 Kubernetes 架构和生态,有丰富的云原生机器学习系统实践和开发经验,对在线服务治理、部署架构有深入理解和落地经验
掌握分布式系统原理,参与过大规模分布式系统的设计、开发和维护
有优秀的逻辑分析能力,能够对业务逻辑进行合理的抽象和拆分
有强烈的工作责任心,较好的学习能力、沟通能力和自驱力,能够快速的响应和行动
有良好的工作文档习惯,及时按要求撰写更新工作流程及技术文档

工作职责

负责机器学习系统推理架构和产品的设计开发,支持火山方舟大模型平台和机器学习平台的产品业务

负责深度模型推理任务为核心的在线架构设计与优化,充分利用各种异构计算(GPU、CPU、其他异构硬件)、存储(各种云存储)、网络(VPC、RDMA)等资源,构建多租环境下的稳定性、观测体系,实现高并发、高吞吐的大规模在线系统
负责推理系统的产品化落地,打造稳定、可观测、体验一流的公有云推理平台

优先资格

有在线GPU推理系统的工程架构落地经验,熟悉常见的在线推理优化手段(Batch、量化、分布式推理等),熟悉GPU、大模型相关软硬件技术栈

熟悉公有云推理产品架构,对该领域用户画像和用户故事有深入理解,有打造世界级产品的热情
有以下某一方向领域的经验:CUDA,RDMA,AI Infrastructure,HW/SW Co-Design,High Performance Computing,ML Hardware Architecture (GPU, Accelerators, Networking),ML for System,Distributed Storage

AI 洞察

优缺点分析

优点

  • 深度参与大模型时代核心基础设施,技术前沿且影响力大
  • 与顶尖工程师合作,接触大规模分布式系统和云原生最佳实践
  • 要求高,需要同时具备系统、算法和云原生多领域知识,学习曲线陡峭
  • 技术迭代快,需要持续跟进GPU、大模型等新技术动态

缺点 / 挑战

  • 字节跳动大平台,资源丰富,技术挑战高,成长空间巨大
  • 在线推理系统对稳定性、延迟要求极高,工作压力可能较大
  • 适合对AI基础设施充满热情、具备扎实后端和云原生功底、乐于攻克高难度技术挑战的工程师

角色解读

  • 成为AI基础设施领域的专家,主导大模型推理架构演进
  • 向技术管理方向转型,带领团队打造世界级云推理产品
  • 横向扩展到训练、存储等AI系统其他模块,成为全栈AI系统专家
  • 设计开发火山方舟大模型平台中的推理系统架构和产品,支撑高并发推理服务
  • 针对深度学习推理任务进行在线架构优化,利用GPU等异构计算资源提升吞吐和降低延迟
  • 构建多租户环境下的稳定性、可观测性体系,确保公有云推理平台稳定可靠
  • 推动推理产品化落地,打造用户友好的公有云推理产品体验
  • 精通Go/Java/Python中的至少一种,具备扎实的编程和数据结构算法能力
  • 深度掌握Kubernetes生态和云原生技术,有大规模在线服务治理经验
  • 熟悉TensorFlow/PyTorch等深度学习框架,理解分布式系统原理
  • 加分项:GPU推理优化、CUDA、RDMA、高性能计算等经验

申请策略

  • 在面试中强调对公有云推理产品的理解,包括用户场景和竞品分析
  • 表达对打造世界级产品的热情和长期技术追求
  • 突出云原生机器学习系统项目经验,特别是Kubernetes上部署和管理推理服务的案例
  • 详细描述在分布式系统设计、性能优化方面的成果,用数据量化提升
  • 如果有GPU推理优化、量化、批处理等经验,务必单独列出
  • 展示对深度学习框架(TensorFlow/PyTorch)的深入理解,尤其是模型部署部分
  • 系统学习CNCF云原生生态,特别是Kubernetes Operator和CRD开发
  • 实践大模型推理框架如vLLM、Triton Inference Server,了解优化手段

面试指南

  • 对于系统设计题,先明确需求(QPS、延迟、成本),再给出架构(负载均衡、自动缩放、推理引擎选择),最后讨论优化点
  • 对于项目经历题,使用STAR法则:背景、任务、行动、结果,重点突出技术选型和量化收益
  • 对于技术趋势题,结合业界进展(如TensorRT-LLM、vLLM)和自己的实践,展现思考深度
  • 如何设计一个高并发、低延迟的在线推理系统?
  • 在Kubernetes上部署推理服务时,如何实现弹性伸缩和资源隔离?
  • 介绍一次你优化模型推理性能的经历,用了哪些技术手段?
  • 如何处理多租户场景下的稳定性问题?
  • 你对大模型推理的优化趋势(如投机解码、量化)有什么看法?

职位点评

76
综合评分

大厂核心AI基础设施岗,前沿技术栈,薪资优厚,但工作强度较大。

更适合这类人
最适合高度追求技术成长和职业发展的求职者,愿意在高强度工作中快速提升。
表现最好
成长发展
相对薄弱
工作生活
薪资福利90
成长发展95
工作生活50
使命价值70

薪资福利

90较高

字节跳动大厂,薪酬福利处于行业顶尖水平,且岗位涉及核心业务,补偿性动机能得到充分满足。

薪资信号未披露(AI估算:30K-60K/月)

成长发展

95较高

岗位专注于AI基础设施前沿技术(大模型推理、GPU优化、云原生),技术栈新且成长空间巨大,发展性动机极强。

技术前沿前沿/新兴技术
技术栈GPU、Kubernetes、大模型推理、云原生、分布式系统
业务类型profit_center

工作生活

50较低

字节跳动通常工作强度较高,且未提及灵活办公或WLB信息,生活化动机满足度一般。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值

70中等

作为公有云AI基础设施,有助于推动大模型技术普惠,但使命感表述含蓄,意义感适中。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 多媒体处理高级开发工程师

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 招聘专家-广告

    字节跳动 · 北京市
    AI 估算 · 20k-35k
  • 自动化开发专家-TikTok(杭州/上海)

    字节跳动 · 杭州市
    AI 估算 · 35k-65k
  • AI业务研发工程师-TikTok Shop

    字节跳动 · 上海市
    AI 估算 · 25k-50k
  • 平台产品经理(游戏AI方向)-抖音

    字节跳动 · 深圳市
    AI 估算 · 25k-45k

相似职位推荐

  • Student Intern-SYNC

    西门子 · 上海市
    AI 估算 · 4k-6k
  • Advanced Software Engineer-C++

    飞利浦 · 沈阳市
    AI 估算 · 15k-25k
  • Advanced Software Engineer-C++

    飞利浦 · 沈阳市
    AI 估算 · 25k-40k
  • 2027 Campus - Software Development Engineer - Industrial & IoT

    恩智浦半导体 · 北京市
    AI 估算 · 15k-25k
  • 大模型推理部署优化实习生-AI引擎

    米哈游 · 上海市
    AI 估算 · 4k-8k

字节跳动 的其他在招职位

  • 多媒体处理高级开发工程师

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 招聘专家-广告

    字节跳动 · 北京市
    AI 估算 · 20k-35k
  • 自动化开发专家-TikTok(杭州/上海)

    字节跳动 · 杭州市
    AI 估算 · 35k-65k
  • AI业务研发工程师-TikTok Shop

    字节跳动 · 上海市
    AI 估算 · 25k-50k
  • 平台产品经理(游戏AI方向)-抖音

    字节跳动 · 深圳市
    AI 估算 · 25k-45k

相似职位推荐

  • Student Intern-SYNC

    西门子 · 上海市
    AI 估算 · 4k-6k
  • Advanced Software Engineer-C++

    飞利浦 · 沈阳市
    AI 估算 · 15k-25k
  • Advanced Software Engineer-C++

    飞利浦 · 沈阳市
    AI 估算 · 25k-40k
  • 2027 Campus - Software Development Engineer - Industrial & IoT

    恩智浦半导体 · 北京市
    AI 估算 · 15k-25k
  • 大模型推理部署优化实习生-AI引擎

    米哈游 · 上海市
    AI 估算 · 4k-8k