Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
广告大模型训练/推理优化研发工程师-Data
立即应聘

广告大模型训练/推理优化研发工程师-Data

发布于 大约 12 小时前

普通员工/个人贡献者

北京市
高级经验
全职员工
仅现场办公
学历未注明
PyTorch
CUDA
分布式训练
DeepSpeed
SGLang
vLLM
FSDP

AI 估算 · 30k–60k

高级大模型优化岗稀缺性强,字节跳动薪资竞争力高,且涉及核心广告系统,月薪3-6万合理。

职位详情

关于这个职位

加入字节跳动Data团队,负责广告大模型的训练与推理优化

你将深入深度学习引擎,优化算子性能,支持大规模分布式训练与推理系统,推动前沿技术在广告场景落地
适合对高性能计算、系统优化有热情的工程师

最低要求

至少精通一门编程语言(如C、C++、Python),具备优秀的编码习惯并注重代码质量

扎实的计算机科学基础,深入理解数据结构与算法、操作系统、计算机体系结构、高性能编程等核心知识
了解PyTorch等深度学习框架,有FSDP,DeepSpeed等分布式训练经验
熟悉vLLM、SGLasng等推理框架
具备高性能编程经验,熟悉Triton、CUDA、AscendC、BangC、DCU等编程

工作职责

深度学习引擎优化,参与训练和推理引擎的深度优化,包括编译优化、图融合技术、并行计算策略、低精度计算等

高性能算子与框架研发,负责自研高性能算子库建设,进行异构硬件适配,利用SIMD、CUDA等技术实现算子的并行加速
长序列的大规模分布式训练(DDP/FSDP/TP/SP/PP)和推理支持(RPC框架/vLLM/SGLang/TRT)
前沿技术调研与落地,探索下一代硬件架构、异构计算方案,将前沿技术转化为生产力

AI 洞察

优缺点分析

优点

  • 技术前沿:涉及大模型训练/推理优化,紧跟AI基础设施热点,技能积累价值高
  • 薪资丰厚:互联网大厂高级岗位薪资有竞争力,且核心部门奖金可观
  • 工作强度:字节跳动通常节奏快,项目周期紧,可能需要处理线上突发问题
  • 技术难度:需要对系统底层和分布式有深入理解,学习曲线陡峭
  • 适合对系统性能极致追求、热爱底层优化、自驱力强的技术型人才

缺点 / 挑战

  • 平台资源:字节跳动广告业务规模大,数据量大,有挑战性场景

角色解读

  • 技术深耕:成为深度学习系统优化专家,主导引擎架构演进
  • 业务拓展:转向广告推荐系统全栈优化,结合业务需求推动模型迭代
  • 管理方向:带领团队负责核心基础设施研发,向技术经理或架构师发展
  • 深度优化深度学习引擎,通过编译优化、图融合、低精度计算等技术提升训练和推理效率
  • 研发高性能算子库,针对异构硬件(GPU、NPU等)进行并行加速,使用CUDA、Triton等工具
  • 支持长序列的大规模分布式训练(如FSDP、TP)和推理框架(vLLM、SGLang)的部署与调优
  • 跟踪前沿技术,探索下一代硬件架构和异构计算方案,并推动在广告场景落地
  • 精通C/C++和Python,具备优秀的编码和调试能力
  • 扎实的计算机体系结构、操作系统、数据结构与算法基础
  • 熟悉PyTorch及分布式训练框架(FSDP、DeepSpeed),了解推理框架(vLLM、SGLang)
  • 具备高性能编程经验,熟悉CUDA、Triton等并行计算技术

申请策略

  • 在简历中用量化指标展示优化成果(如“将推理延迟降低30%”)
  • 了解字节广告系统的基本知识,体现业务理解
  • 突出分布式训练或推理优化的项目经验,包括具体优化手段和收益(如吞吐量提升、显存节省)
  • 展示编程语言(C++/Python)和并行计算(CUDA/Triton)的深度使用案例
  • 若参与过开源项目(如vLLM、DeepSpeed)或贡献过算子库,务必列出
  • 补充学习:如果未接触过vLLM或SGLang,可以动手部署并阅读源码
  • 深入学习:掌握CUDA编程模型、GPU架构细节,理解分布式训练通信模式

面试指南

  • 对于优化类问题,采用“问题-方案-效果”结构,先说明瓶颈,再给出具体优化技术,最后量化收益
  • 对于原理对比类问题,先简要定义,再比较异同和适用条件,最后给出自己的理解或经验
  • 请描述你做过的一次深度学习模型训练加速的优化案例
  • 解释FSDP和DeepSpeed ZeRO的区别和适用场景
  • 如何优化一个Transformer模型的推理延迟?请从算子融合和显存管理角度分析
  • CUDA中shared memory和global memory的使用场景和优化技巧
  • vLLM中的PagedAttention是如何工作的?优势在哪里?
  • 复习分布式训练相关论文(如ZeRO、Megatron-LM),准备手撕C++或CUDA代码

匹配度报告

66
综合匹配度

大厂核心岗位、前沿技术栈、高薪资,但WLB较差。

适合人群
适合看重技术成长和薪资回报,能接受高强度工作节奏的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展90
工作生活35
使命价值55

薪资福利匹配

85较高

字节跳动薪资在业内具有竞争力,且高级岗位配股票和年终奖,补偿性动机满足度高。但JD未明确提及福利,故分数略低于顶级。

薪资信号未披露(AI估算:30K-60K/月)

成长发展匹配

90较高

职位涉及前沿的大模型训练/推理优化技术,接触最新硬件和框架,成长空间大。但JD未明确提及晋升通道或培训,出于严谨性略减分。

技术前沿前沿/新兴技术
技术栈深度学习引擎优化、编译优化、图融合、低精度计算、SIMD、CUDA、分布式训练、DDP、FSDP、TP、SP、PP、vLLM、SGLang、TRT、Triton、AscendC、BangC、DCU
业务类型profit_center

工作生活匹配

35较低

JD未提及远程或弹性工作,字节跳动通常要求现场办公且工作节奏较快,WLB信号较弱。

工作模式未明确
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

55较低

广告业务属于成熟商业模式,社会影响力中性,技术本身有创新价值但非直接使命驱动。

行业发展稳定成熟行业
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 视觉设计师(运营方向)-飞书(杭州/上海)

    字节跳动 · 杭州市
    AI 估算 · 15k-25k
  • 达人内容治理策略运营-TikTok Shop

    字节跳动 · 上海市
    AI 估算 · 20k-35k
  • 大模型应用算法工程师(People)-集团信息系统

    字节跳动 · 杭州市
    AI 估算 · 25k-45k
  • 增长营销资深运营经理(供应商管理方向)-TikTok

    字节跳动 · 北京市
    AI 估算 · 30k-50k
  • 搜索增长产品经理(AI创作方向)-TikTok

    字节跳动 · 北京市
    AI 估算 · 25k-45k

字节跳动 的其他在招职位

  • 视觉设计师(运营方向)-飞书(杭州/上海)

    字节跳动 · 杭州市
    AI 估算 · 15k-25k
  • 达人内容治理策略运营-TikTok Shop

    字节跳动 · 上海市
    AI 估算 · 20k-35k
  • 大模型应用算法工程师(People)-集团信息系统

    字节跳动 · 杭州市
    AI 估算 · 25k-45k
  • 增长营销资深运营经理(供应商管理方向)-TikTok

    字节跳动 · 北京市
    AI 估算 · 30k-50k
  • 搜索增长产品经理(AI创作方向)-TikTok

    字节跳动 · 北京市
    AI 估算 · 25k-45k