Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
大模型推理优化工程师-Commercial AI
立即应聘

大模型推理优化工程师-Commercial AI

发布于 大约 10 小时前

普通员工/个人贡献者

北京市
高级经验
全职员工
仅现场办公
学历未注明
分布式系统
PyTorch
TensorFlow
高性能计算
CUDA
SGLang
vLLM
TRT-LLM
PaddlePaddle
Mindspore

AI 估算 · 35k–55k

大模型推理优化属于AI核心技术岗位,字节跳动薪资竞争力强,结合北京市场行情,月薪35k-55k合理。

职位详情

关于这个职位

该职位主要负责超大规模机器学习系统的架构设计与开发,专注于大模型分布式推理任务的性能优化、流量调度和池化部署

你将与算法团队深度合作,进行算法与系统的联合优化,并涉及国产硬件的适配与性能调优
工作内容涵盖LLM、MLLM、Diffusion等多个前沿场景,技术挑战大,发展前景广阔

最低要求

代码能力、数据结构和基础算法功底,熟练掌握Linux环境下的C/C++、Python

熟悉至少一种机器学习框架(PyTorch/TensorFlow/PaddlePaddle/Mindspore等训练框架),以及对应框架相应技术生态
熟悉大模型推理框架(如vLLM/SGLang/TRT-LLM等框架)
掌握分布式系统原理,参与过分布式系统的设计、开发和维护
有强烈的工作责任心,较好的学习能力、沟通能力和自驱力,能够快速的响应和行动
较强的自驱学习能力,对端到端系统设计、编码规范和系统优化有高标准要求

工作职责

负责超大规模机器学习系统架构的设计开发,解决系统高并发、高可靠性、高可扩展性等技术难关

负责大模型分布式推理任务性能优化,流量调度,池化部署等,涵盖LLM/MLLM/Diffusion等多个场景
与算法部门深度合作,进行算法与系统的联合优化
国产硬件的适配和性能优化

优先资格

熟悉LLM、MLLM、NLP、CV、语音相关的算法和技术,熟悉大模型推理、模型压缩技术等

熟悉高性能编程,例如CUDA、向量化、并行化
或具有AI编译器相关经验
熟悉国产异构硬件并有相关训练框架或高性能算子调优经验

AI 洞察

优缺点分析

优点

  • 身处AI大模型浪潮的核心岗位,技术前沿,积累稀缺的推理优化经验
  • 字节跳动平台大,资源丰富,能与顶尖算法团队合作,快速提升工程和技术能力
  • 薪资待遇优厚,股票期权等福利可观,职业发展空间大
  • 涉及国产硬件适配,符合国家战略方向,未来前景广阔
  • 技术难度高,需要同时掌握分布式系统、深度学习框架和硬件优化,学习曲线陡峭
  • 对自驱力和学习能力要求极高,需要不断跟进最新技术发展

缺点 / 挑战

  • 工作强度较大,可能面临紧急优化任务和快速迭代的压力
  • 适合对AI系统优化有浓厚兴趣、编程基础扎实、渴望挑战前沿技术并愿意在高压环境下快速成长的工程师

角色解读

  • 技术纵深发展:成为大模型推理优化领域的专家,深入GPU编程、AI编译器、国产硬件优化等方向
  • 技术管理路线:逐步担任技术Leader,带领团队攻克系统级难题,向架构师或技术总监发展
  • 跨界融合:结合算法与工程能力,转向AI平台或全栈AI系统设计,拓宽职业边界
  • 负责设计并开发超大规模机器学习系统架构,解决高并发、高可靠性和高可扩展性等技术难题
  • 专注于大模型(如LLM、MLLM、Diffusion)的分布式推理性能优化,包括流量调度和池化部署
  • 与算法部门紧密协作,进行算法与系统的联合优化,提升整体效率
  • 参与国产硬件的适配与性能调优,推动自主可控技术落地
  • 扎实的编程基础:精通C/C++和Python,熟悉Linux开发环境,掌握数据结构与算法
  • 深度学习框架经验:熟悉至少一种主流框架(PyTorch、TensorFlow等),理解其技术生态
  • 大模型推理框架:熟悉vLLM、SGLang、TRT-LLM等推理框架的原理与使用
  • 分布式系统知识:掌握分布式系统原理,有实际设计、开发和维护经验

申请策略

  • 关注字节跳动技术博客和开源项目,了解其技术栈和工程文化,面试中展现契合度
  • 准备一个自己主导的性能优化案例,从问题定位到解决方案的完整思路,体现系统性思维
  • 突出分布式系统设计或大模型推理优化的实际项目经验,用具体数据展示性能提升(如延迟降低、吞吐量提升)
  • 展示对深度学习框架(尤其是PyTorch)的深度理解,包括底层算子、内存管理等
  • 强调高性能编程能力,如CUDA优化、向量化等,并提供相关代码或开源贡献链接
  • 如有国产硬件(如华为昇腾、寒武纪)的适配经验,务必重点描述
  • 补充大模型推理框架(vLLM、TRT-LLM)的源代码阅读和实战调试
  • 学习GPU编程(CUDA)和AI编译器(如TVM、MLIR)的基础知识

面试指南

  • 对于项目类问题:使用STAR法则(情境、任务、行动、结果),强调个人贡献和技术细节
  • 对于技术对比类问题:先分别简述各框架特点,再从性能、易用性、生态等维度对比,最后结合实际场景给出建议
  • 对于优化类问题:先分析瓶颈(计算、I/O、通信),再提出针对性方案(算子融合、量化、并行策略等),并用数据证明效果
  • 请讲讲你参与过的一个分布式系统设计或优化项目,遇到了哪些挑战?如何解决?
  • 如何优化大模型推理的吞吐量和延迟?请举例说明
  • 你熟悉哪些推理框架?比较vLLM和TRT-LLM的优缺点
  • 请解释CUDA编程中的内存管理策略,如何避免显存瓶颈?
  • 当模型在国产硬件上性能不佳时,你会如何排查和优化?

匹配度报告

72
综合匹配度

字节大模型推理优化岗,前沿技术、薪资丰厚,但需现场办公且WLB一般。

适合人群
适合追求技术成长、高薪回报,且愿意接受较高工作强度的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展90
工作生活45
使命价值70

薪资福利匹配

85较高

字节跳动作为头部互联网公司,提供极具竞争力的薪资和福利,包括股票期权、年终奖等,能较好满足补偿性动机。

薪资信号未披露(AI估算:35K-55K/月)

成长发展匹配

90较高

岗位紧贴大模型前沿,技术栈现代,涉及推理优化、分布式系统等核心方向,成长空间极大。

技术前沿前沿/新兴技术
技术栈LLM、MLLM、Diffusion、vLLM、SGLang、TRT-LLM、CUDA、分布式系统
业务类型profit_center

工作生活匹配

45较低

北京现场办公,互联网公司通常工作强度较大,但未在JD中明确提及加班或弹性工作,综合来看WLB一般。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

70中等

大模型技术推动AI发展,具有较强社会影响力;但岗位偏工程优化,使命感相对中性。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 直播高级产品经理(激励增长方向)-抖音直播

    字节跳动 · 北京市
    AI 估算 · 35k-55k
  • 资深架构师(机审方向)-国际化内容安全平台

    字节跳动 · 上海市
    AI 估算 · 50k-70k
  • 豆包AI大模型数据分析-火山方舟MaaS

    字节跳动 · 杭州市
    AI 估算 · 25k-45k
  • 商业产品经理(线索闭环化方向)-抖音生活服务

    字节跳动 · 上海市
    AI 估算 · 25k-45k
  • AI应用开发工程师-Cross Platform

    字节跳动 · 上海市
    AI 估算 · 30k-50k

字节跳动 的其他在招职位

  • 直播高级产品经理(激励增长方向)-抖音直播

    字节跳动 · 北京市
    AI 估算 · 35k-55k
  • 资深架构师(机审方向)-国际化内容安全平台

    字节跳动 · 上海市
    AI 估算 · 50k-70k
  • 豆包AI大模型数据分析-火山方舟MaaS

    字节跳动 · 杭州市
    AI 估算 · 25k-45k
  • 商业产品经理(线索闭环化方向)-抖音生活服务

    字节跳动 · 上海市
    AI 估算 · 25k-45k
  • AI应用开发工程师-Cross Platform

    字节跳动 · 上海市
    AI 估算 · 30k-50k