Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
AML-火山方舟大模型推理系统工程师
立即应聘

AML-火山方舟大模型推理系统工程师

发布于 大约 2 小时前

普通员工/个人贡献者

杭州市
高级经验
全职员工
仅现场办公
学历未注明
分布式系统
GPU
PyTorch
性能优化
TensorFlow
CUDA
vLLM
TensorRT-LLM
大模型训练推理

AI 估算 · 30k–60k

大模型推理系统核心岗位,技术难度高,市场稀缺,字节薪资竞争力强,预估月薪30-60K。

职位详情

关于这个职位

负责火山引擎大模型训练和推理系统的研发与性能优化,解决高并发、高可靠性等技术难题,支撑千亿级日均Token流量

需要深入理解分布式系统、GPU硬件和主流大模型推理框架,是技术攻坚型岗位

最低要求

熟练掌握Linux环境下的C/C++与Python语言,有大规模机器学习系统或搜广推推荐系统相关经验

熟悉至少一种机器学习框架(Tensorflow/PyTorch/MxNet或其他自研框架)
熟悉至少一种大模型训练/推理框架,包括但不限于:vLLM、TensorRT-LLM、SGLang、Megatron-LM等
具有独立解决问题的能力,良好的团队合作精神,具备优秀的复杂问题拆解能力
有强烈的工作责任心,较好的学习能力、沟通能力和自驱力

工作职责

负责火山引擎大模型训练和推理系统的研发与性能优化,包括但不限于:模型计算性能优化、千卡训练集群调优、分布式大模型推理系统、大规模推理流量调度等

负责解决系统高并发、高可靠性、高可扩展性等技术难关,支撑火山引擎千亿级别的日均Token训练推理流量
负责大模型训练和推理前瞻性技术架构的调研和引入,技术方案不限于子图匹配、编译优化、模型量化等
负责异构硬件的引入与训练推理框架的集成,包括但不限于GPU、NPU、TPU等
面向全球多地域超大规模GPU算力集群,通过弹性调度、GPU超卖、任务编排等方式不断提升算力利用率
与算法部门深度合作,进行算法与系统的联合优化

优先资格

有大规模分布式系统架构设计经验

理解GPU硬件架构,理解GPU软件栈(CUDA,cuDNN),具备GPU性能分析的经验
有硕士研究生或博士研究生阶段的计算机系统方向(包含分布式系统,并行计算,编程语言与编译器,网络,存储等)研究背景

AI 洞察

优缺点分析

优点

  • 站在大模型技术前沿,参与核心基础设施建设
  • 薪资待遇优厚,股权奖励可观
  • 技术难度高,需要持续学习最新框架和硬件
  • 工作强度较大,可能需要应对紧急上线和调优
  • 行业内人才竞争激烈,需要保持技术领先
  • 适合对系统性能优化有热情、技术功底扎实、能承受高强度工作的资深工程师

缺点 / 挑战

  • 字节跳动平台资源丰富,技术挑战大,成长快

角色解读

  • 技术深度发展:成为大模型推理系统领域的资深专家
  • 架构方向:负责更大规模分布式系统的架构设计
  • 管理方向:带领团队(Tech Lead)或转为技术管理岗
  • 研发和优化大模型训练与推理系统,提升计算性能和吞吐量
  • 解决高并发、高可靠性等技术难题,支撑千亿级日均Token流量
  • 调研引入前沿技术架构,如子图匹配、编译优化、模型量化等
  • 与算法部门协作,实现算法与系统的联合优化
  • 精通C/C++和Python,具备大规模机器学习系统经验
  • 熟悉至少一种深度学习框架(PyTorch/TensorFlow等)
  • 掌握主流大模型推理框架(vLLM、TensorRT-LLM等)
  • 理解GPU硬件架构和CUDA编程,有性能分析能力

申请策略

  • 准备一个完整的项目经历,说明如何优化系统提升吞吐量或降低延迟
  • 了解火山引擎和字节跳动大模型业务布局,展示技术热情
  • 突出大规模机器学习系统或推荐系统的实践经验,尤其是性能优化案例
  • 展示对主流大模型推理框架(vLLM、TensorRT-LLM)的使用或二次开发经验
  • 强调C++/Python编程能力以及GPU编程(CUDA)项目
  • 描述解决高并发、分布式系统问题的具体成果
  • 深入了解vLLM或TensorRT-LLM的源码,尝试贡献代码
  • 学习GPU性能分析工具(Nsight、Profiler)和模型量化技术

面试指南

  • 从问题分析、方案设计、实现细节、效果量化四个方面回答技术问题
  • 对于系统设计类问题,先明确需求边界,再给出架构方案,最后讨论权衡
  • 如何优化Transformer推理中的显存占用和延迟?
  • 请解释vLLM的PagedAttention原理及其优势
  • 描述一次你解决分布式训练或推理系统性能瓶颈的经历
  • CUDA kernel优化中,如何有效利用共享内存和寄存器?
  • 大模型推理服务如何实现高并发和负载均衡?
  • 复习GPU架构和CUDA优化技巧,准备一个相关项目案例

匹配度报告

72
综合匹配度

顶尖大模型推理系统岗,技术前沿、薪资优厚,但WLB较差。

适合人群
最看重技术成长和薪资回报,能接受高强度工作的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展95
工作生活40
使命价值70

薪资福利匹配

85较高

薪资位于行业顶尖水平,字节跳动福利完善(五险一金、补充医疗、年终奖等),补偿性动机满足程度高。

薪资信号市场水准 (30K-60K/月)

成长发展匹配

95较高

处于大模型技术前沿,涉及最新框架和硬件,成长空间巨大,但JD未明确提及晋升通道。

技术前沿前沿/新兴技术
技术栈大模型推理、vLLM、TensorRT-LLM、GPU、CUDA、分布式系统
业务类型profit_center

工作生活匹配

40较低

仅现场办公,字节工作强度较大,未提弹性工作或WLB,生活化动机满足程度低。

工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值匹配

70中等

AI基础设施岗位,对社会智能化发展有间接推动作用,但JD未强调使命感。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 增长算法工程师-抖音直播

    字节跳动 · 北京市
    AI 估算 · 30k-60k
  • 用户产品经理(同城Tab方向)-TikTok生活服务

    字节跳动 · 上海市
    AI 估算 · 15k-25k
  • 推荐算法专家-抖音推荐技术

    字节跳动 · 北京市
    AI 估算 · 35k-55k
  • 服务器装备测试/Diag 工程师

    字节跳动 · 北京市
    AI 估算 · 30k-50k
  • 服务器硬件研发维护专家-Data

    字节跳动 · 深圳市
    AI 估算 · 30k-50k

相似职位推荐

  • 【快Star】大模型系统开发工程师

    快手 · 北京市
    AI 估算 · 25k-35k
  • 【快Star】推荐大模型训练引擎研发工程师

    快手 · 北京市
    AI 估算 · 30k-60k
  • 【快Star】多模态推理平台工程师

    快手 · 北京市
    AI 估算 · 25k-45k
  • 【快Star】增长激励算法工程师

    快手 · 北京市
    AI 估算 · 35k-60k
  • 【快Star】混合云AI推理工程师

    快手 · 北京市
    AI 估算 · 30k-50k

字节跳动 的其他在招职位

  • 增长算法工程师-抖音直播

    字节跳动 · 北京市
    AI 估算 · 30k-60k
  • 用户产品经理(同城Tab方向)-TikTok生活服务

    字节跳动 · 上海市
    AI 估算 · 15k-25k
  • 推荐算法专家-抖音推荐技术

    字节跳动 · 北京市
    AI 估算 · 35k-55k
  • 服务器装备测试/Diag 工程师

    字节跳动 · 北京市
    AI 估算 · 30k-50k
  • 服务器硬件研发维护专家-Data

    字节跳动 · 深圳市
    AI 估算 · 30k-50k

相似职位推荐

  • 【快Star】大模型系统开发工程师

    快手 · 北京市
    AI 估算 · 25k-35k
  • 【快Star】推荐大模型训练引擎研发工程师

    快手 · 北京市
    AI 估算 · 30k-60k
  • 【快Star】多模态推理平台工程师

    快手 · 北京市
    AI 估算 · 25k-45k
  • 【快Star】增长激励算法工程师

    快手 · 北京市
    AI 估算 · 35k-60k
  • 【快Star】混合云AI推理工程师

    快手 · 北京市
    AI 估算 · 30k-50k