Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
AI Infra工程师-Commercial AI
立即应聘

AI Infra工程师-Commercial AI

发布于 大约 14 小时前

普通员工/个人贡献者

北京市
中级经验
全职员工
仅现场办公
本科
PyTorch
TensorFlow
CUDA
分布式训练
推理优化
vLLM
TensorRT-LLM

AI 估算 · 40k–70k

字节跳动顶级AI Infra岗位,技术门槛高,市场稀缺,北京一线大厂薪资水平,预计月薪40-70K。

职位详情

关于这个职位

作为字节跳动Commercial AI团队的AI Infra工程师,你将专注于大规模分布式训练与推理基础设施的研发,深度优化计算、通信与存储性能,确保千卡级任务集群的高效运行

你将针对NVIDIA GPU和NPU进行性能调优,并设计高性能推理引擎,打造极致低延迟与高吞吐的线上服务架构
这是一个技术挑战大、发展前景广阔的岗位,适合对AI基础设施有浓厚兴趣的工程师

最低要求

本科及以上学历,计算机相关专业优先,熟练掌握C++/Python,精通数据结构与算法,并有并发编程基础

熟练使用PyTorch/TensorFlow或其他深度学习框架,熟练掌握深度学习性能加速技术包括但不限于计算图优化,算子性能优化,通信优化等
具有AIGC(VLM、Diffusion)模型训练/推理优化经验,熟悉TensorRT-LLM、vLLM、LightX2V等推理效率优化工具
积极主动有热情,具备较强的沟通能力以及优秀的团队协作能力

工作职责

负责LLM/VLM/AIGC大规模分布式训练与推理基础设施的研发,深度优化计算、通信与存储性能,保障(多至)千卡任务集群的高效运行

针对NVIDIA GPU(CUDA/Triton)、NPU进行深度性能调优,包括算子融合、显存管理优化、通信算子重叠(Overlap)等,将硬件算力发挥到极致
设计并实现高性能LLM/VLM/AIGC模型推理引擎,优化计算图编译、动态Batching及KV Cache管理,打造极致低延迟与高吞吐的线上服务架构
技术演进与落地:持续跟进业界最新的Infra技术(如FlashAttention演进、高效通信库、FP8/INT8量化、稀疏蒸馏等训练部署方案),配合实际业务驱动技术预研并转化为生产力

AI 洞察

优缺点分析

优点

  • 技术前沿:专注于LLM/VLM/AIGC等最热门AI领域的Infra研发,技术含量高,成长空间大
  • 薪资待遇:一线大厂薪资水平,提供有竞争力的薪酬和福利,包括年终奖、股票期权等
  • 团队氛围:与优秀的同事共事,技术交流密集,能快速提升个人能力
  • 工作强度较大,项目周期紧,可能需要应对紧急问题和高强度加班
  • 作为核心岗位,需要同时支持多个业务线,对沟通协调能力要求高

缺点 / 挑战

  • 平台优势:字节跳动作为头部互联网公司,拥有海量数据和丰富业务场景,技术挑战和影响力兼备
  • 技术要求极高,需要持续学习最新技术,对个人学习能力和抗压能力有较高要求
  • 这个职位适合对AI基础设施有浓厚兴趣、技术功底扎实、渴望在顶尖技术团队中挑战自我的工程师

角色解读

  • 纵向成长为AI Infra方向的专家,深耕分布式系统、GPU性能优化等尖端技术
  • 横向发展至AI平台的架构师或技术负责人,主导大型AI基础设施的规划与设计
  • 积累业务理解后转向技术管理,带领团队攻克技术难题,推动业务创新
  • 负责大规模分布式训练与推理基础设施的研发与性能优化,确保千卡级集群高效运行
  • 针对NVIDIA GPU、NPU进行深度调优,包括算子融合、显存管理和通信优化,极致发挥硬件算力
  • 设计高性能推理引擎,优化计算图编译、动态Batching和KV Cache管理,实现低延迟高吞吐
  • 持续跟进前沿Infra技术,推动新技术在实际业务中的应用与落地
  • 精通C++与Python,具备扎实的数据结构与算法基础,以及并发编程能力
  • 熟练使用PyTorch/TensorFlow,掌握深度学习性能加速技术(计算图优化、算子优化、通信优化)
  • 具有AIGC模型训练/推理优化经验,熟悉TensorRT-LLM、vLLM等推理优化工具
  • 积极主动,具备良好的沟通能力和团队协作精神

申请策略

  • 了解字节跳动Commercial AI的业务方向(如抖音、TikTok等场景的AI服务),在面试中展现业务理解
  • 准备一个完整的项目案例,详细描述从问题定义到优化落地的全过程,突出个人贡献和思考
  • 突出在分布式训练或推理优化方面的项目经验,量化性能提升成果(如吞吐量、延迟、显存节省等)
  • 强调对GPU底层优化(CUDA、Triton)或推理引擎(TensorRT-LLM、vLLM)的熟练程度
  • 展示在C++/Python编程、并发编程、数据结构与算法方面的能力,最好有开源贡献或技术博客
  • 体现对AIGC模型(如LLM、Diffusion)的深刻理解,包括训练和推理的常见瓶颈及优化方法
  • 深入学习CUDA编程和GPU架构,尝试实现一些算子融合或通信优化的小项目
  • 熟悉TensorRT-LLM或vLLM的源码,了解其核心优化策略,并尝试复现或改进

面试指南

  • STAR法则:描述情境(Situation)、任务(Task)、行动(Action)、结果(Result),量化成果
  • 分层分析:从算法、系统、硬件三个层面逐一分析问题,展示系统性思维
  • 对比方案:在优化时,提出多种方案并对比优劣,体现技术深度和决策能力
  • 请详细描述你参与过的一个大规模分布式训练优化项目,你负责了哪些部分?解决了什么问题?
  • 谈谈你对FlashAttention的理解?相比标准Attention有哪些优势?如何实现?
  • 如何优化一个Transformer模型的推理延迟?请从模型、系统、硬件层面分别说明
  • 在PyTorch中,如何实现高效的分布式数据并行?谈谈你对NCCL和Gloo通信库的熟悉程度
  • 假设你有一个1000卡的任务,训练效率不高,你会从哪些角度排查性能瓶颈?

匹配度报告

69
综合匹配度

字节跳动AI Infra岗,前沿技术栈,薪资优厚,但工作强度大,WLB一般。

适合人群
该职位最适合追求技术深度和快速成长、能接受高强度工作的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利80
成长发展92
工作生活35
使命价值70

薪资福利匹配

80较高

字节跳动一线大厂,薪资水平在行业中属于领先地位,但JD未明确福利细节,综合评估补偿性动机满足程度较好。

薪资信号未披露(AI估算:40K-70K/月)

成长发展匹配

92较高

职位涉及最前沿的AI Infra技术(LLM、GPU优化、推理引擎),技术成长空间巨大,但JD未明确提及晋升通道,发展性动机满足度很高。

技术前沿前沿/新兴技术
技术栈LLM、VLM、AIGC、CUDA、Triton、TensorRT-LLM、vLLM、FlashAttention、FP8
成长机会技术演进与落地
业务类型profit_center

工作生活匹配

35较低

JD未提及远程办公或弹性工作,且字节跳动以高强度工作文化著称,办公地点在北京核心区域,生活化动机满足程度较低。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

70中等

AI Infra作为技术基础设施,对推动AI应用发展有间接社会价值,但JD未强调使命感,行业处于高速增长期,意义感动机有一定满足。

行业发展高速增长赛道
社会影响中性/一般
创新程度开拓性创新(行业首创)
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 物流供应商管理专家-TikTok Shop

    字节跳动 · 珠海市
    AI 估算 · 25k-40k
  • 产品经理(广告信号方向)-国际商业化产品与技术(北京/上海)

    字节跳动 · 北京市
    AI 估算 · 25k-40k
  • 消息队列产品经理-Data

    字节跳动 · 杭州市
    AI 估算 · 30k-50k
  • 商家产品运营高级经理-抖音生活服务

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • CRM产品经理(AI方向)-抖音电商

    字节跳动 · 上海市
    AI 估算 · 30k-55k

字节跳动 的其他在招职位

  • 物流供应商管理专家-TikTok Shop

    字节跳动 · 珠海市
    AI 估算 · 25k-40k
  • 产品经理(广告信号方向)-国际商业化产品与技术(北京/上海)

    字节跳动 · 北京市
    AI 估算 · 25k-40k
  • 消息队列产品经理-Data

    字节跳动 · 杭州市
    AI 估算 · 30k-50k
  • 商家产品运营高级经理-抖音生活服务

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • CRM产品经理(AI方向)-抖音电商

    字节跳动 · 上海市
    AI 估算 · 30k-55k