Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
推荐大模型训练/推理优化工程师-电商
立即应聘

推荐大模型训练/推理优化工程师-电商

发布于 大约 16 小时前

普通员工/个人贡献者

上海市
高级经验
全职员工
仅现场办公
本科
PyTorch
TensorFlow
LLM
推荐系统
CUDA
TensorRT
DeepSpeed
SGLang
vLLM
Megatron

AI 估算 · 35k–65k

大模型方向人才稀缺,字节跳动薪资有竞争力,上海高级工程师月薪约35k-65k,含年终奖

职位详情

关于这个职位

该职位负责推荐场景下大语言模型(LLM)的训练与推理优化,包括模型量化、图编译、算子调优等,需要扎实的编程基础和LLM工程经验

你将参与设计新一代推荐系统架构,与算法团队协同推动生成式推荐技术的落地
适合对大规模分布式训练和推理加速有深入理解的工程师

最低要求

扎实的编程和算法基础,熟练掌握C/C++、Python、Java等编程语言,有CUDA开发经验,熟悉TensorRT/Triton/Cutlass经验者优先

熟悉大模型推理加速的研究和技术进展,包括但不限于模型量化、图编译、算子调优、KVCache、PD分离等
掌握LLM训练/推理技术,有实际开发和应用落地经验,例如Megatron、Deepspeed、VLLM、SGLang、TRT-LLM等
对大模型工程有丰富的经验和广阔视野,紧追开源动态,具备独立的Trouble-shooting能力

工作职责

完成LLM训练/推理技术在推荐大模型场景的研发、落地和调优,解决推荐场景的大模型工程问题

针对PyTorch、TensorFlow等框架提供高自动化、极致性能的模型优化方案
推动基于大模型开源组件构建,设计和实现新一代推荐系统架构,支持推荐大模型在业务落地
与算法团队Co-Design,推动端到端生成式推荐技术创新的预研和落地

优先资格

有以下经验者加分:推荐/广告搜索相关的模型开发优化经验,或有大模型开源组件社区贡献

AI 洞察

优缺点分析

优点

  • 身处AI大模型和推荐系统前沿技术交汇点,技能积累极具市场价值
  • 字节跳动拥有海量业务场景和算力资源,能接触超大规模工程实践
  • 团队技术氛围浓厚,与业界顶级专家协作,个人成长迅速
  • 技术栈更新快,需持续学习跟进开源社区动态,保持技术敏感度
  • 推荐场景的大模型工程尚在早期,存在较多不确定性,需要较强的独立探索能力
  • 适合对AI系统工程充满热情、拥有扎实编程和分布式系统功底、追求技术深度和影响力的工程师

缺点 / 挑战

  • 工作强度较大,需应对高并发、低延迟、高吞吐的系统挑战,偶尔需要弹性加班

角色解读

  • 在技术深度上,可向LLM系统架构师或AI基础设施专家发展,主导大规模分布式训练框架的研发
  • 在业务广度上,可转向推荐系统整体架构设计,或跨领域迁移至搜索、广告等核心业务
  • 长期可晋升为技术专家或技术负责人,带领团队攻克下一代AI系统挑战
  • 负责推荐场景下大语言模型的训练与推理优化,包括模型量化、图编译、算子调优等,提升模型性能和效率
  • 基于PyTorch、TensorFlow等框架,开发高自动化的优化方案,并推动新一代推荐系统架构的设计与实现
  • 与算法团队紧密配合,预研端到端生成式推荐技术,并推动其在业务中落地
  • 精通C/C++、Python和CUDA编程,熟悉TensorRT/Triton等推理优化工具
  • 深入理解LLM训练/推理技术栈,如Megatron、DeepSpeed、VLLM、SGLang等,并有实际调优经验
  • 熟悉模型量化、图编译、KVCache等加速技术,具备独立分析并解决系统性能瓶颈的能力

申请策略

  • 提前了解字节跳动推荐架构的技术博客和公开演讲,面试中展现对业务场景的理解
  • 准备一个端到端的LLM优化案例,从问题分析到方案落地,体现系统性思考
  • 突出LLM训练/推理的实际项目经验,尤其是模型部署和优化成果(如加速比、成本降低)
  • 详细描述CUDA编程、量化、图编译等底层优化案例,最好附带性能指标
  • 如有TensorRT、Megatron、DeepSpeed等开源框架的深度使用或贡献经历,务必展示
  • 若缺乏推荐系统经验,可快速学习推荐基础算法和系统架构,通过博客或开源项目补足
  • 深入掌握至少一个推理优化框架(如VLLM或TensorRT-LLM),并动手做性能对比实验

面试指南

  • 采用STAR法则(情境、任务、行动、结果)结构化回答项目经验,重点突出量化指标
  • 对比分析时先明确场景约束(如延迟、吞吐、资源),再给出优先级排序的优化策略
  • 请介绍你参与过的一个LLM推理加速项目,包括遇到的主要性能瓶颈和解决方案
  • 如何在大规模推荐场景下平衡模型效果和推理延迟?举例说明
  • 对比几种量化方法(如INT8、FP8、AWQ),在什么场景下选择哪种?
  • 设计一个系统,支持多租户的LLM推理服务,需要考虑哪些关键因素?
  • 你对PD分离和KVCache有什么理解?在推荐大模型中如何应用?
  • 复习LLM推理全链路知识:从模型量化、计算图优化、KV缓存到分布式部署

匹配度报告

68
综合匹配度

技术前沿、成长性极高、薪资竞争力强,但工作强度大、WLB一般。

适合人群
最适合追求技术前沿和快速成长、高薪回报,能接受高强度工作节奏的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利75
成长发展90
工作生活40
使命价值65

薪资福利匹配

75中等

字节跳动作为上市公司,薪资水平具有竞争力,但JD未透露具体福利,补偿性动机一般满足。

薪资信号未披露(AI估算:35K-65K/月)

成长发展匹配

90较高

大模型和推荐系统均为前沿技术,项目挑战大,技术成长空间极高,发展性动机充分满足。

技术前沿前沿/新兴技术
技术栈LLM、PyTorch、TensorFlow、CUDA、TensorRT、Megatron、DeepSpeed、VLLM、SGLang、推荐系统
业务类型profit_center

工作生活匹配

40较低

JD未提及弹性办公或WLB,大型互联网公司通常需要现场办公且可能加班,生活化动机满足有限。

工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值匹配

65中等

电商推荐场景直接驱动业务增长,有一定商业价值,但未体现社会使命,意义感中等。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 商家BD-抖音生活服务(常州)

    字节跳动 · 常州市
    AI 估算 · 8k-15k
  • 市场营销经理(汽车及泛高科技行业)-飞书

    字节跳动 · 上海市
    AI 估算 · 25k-40k
  • 巨量千川自助客户增长运营-抖音电商

    字节跳动 · 上海市
    AI 估算 · 25k-45k
  • 大客户销售(零售行业)-抖音生活服务(成都)

    字节跳动 · 成都市
    AI 估算 · 20k-40k
  • 高级C++开发工程师 - 飞书视频会议

    字节跳动 · 杭州市
    AI 估算 · 30k-50k

相似职位推荐

  • 广告算法工程师-【海外算法中心】

    快手 · 北京市
    AI 估算 · 30k-60k
  • 高级数据研发工程师-【可灵AI专项】

    快手 · 北京市
    AI 估算 · 30k-50k
  • Java技术专家(架构)-【商业化】

    快手 · 北京市
    AI 估算 · 50k-80k

字节跳动 的其他在招职位

  • 商家BD-抖音生活服务(常州)

    字节跳动 · 常州市
    AI 估算 · 8k-15k
  • 市场营销经理(汽车及泛高科技行业)-飞书

    字节跳动 · 上海市
    AI 估算 · 25k-40k
  • 巨量千川自助客户增长运营-抖音电商

    字节跳动 · 上海市
    AI 估算 · 25k-45k
  • 大客户销售(零售行业)-抖音生活服务(成都)

    字节跳动 · 成都市
    AI 估算 · 20k-40k
  • 高级C++开发工程师 - 飞书视频会议

    字节跳动 · 杭州市
    AI 估算 · 30k-50k

相似职位推荐

  • 广告算法工程师-【海外算法中心】

    快手 · 北京市
    AI 估算 · 30k-60k
  • 高级数据研发工程师-【可灵AI专项】

    快手 · 北京市
    AI 估算 · 30k-50k
  • Java技术专家(架构)-【商业化】

    快手 · 北京市
    AI 估算 · 50k-80k