Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

ByteDance logo
字节跳动
模型架构工程师-抖音直播
立即应聘

模型架构工程师-抖音直播

发布于 大约 11 小时前

普通员工/个人贡献者

北京市
高级经验
全职员工
仅现场办公
学历未注明
软件工程
GPU
PyTorch
TensorFlow
深度学习框架
推荐系统
CUDA
直播
MLIR
分布式训练

AI 估算 · 45k–75k

一线大厂核心岗位,GPU/分布式技术稀缺,薪资竞争力强,结合职级和行业水平估算。

职位详情

关于这个职位

作为抖音直播推荐架构团队的核心成员,你负责直播推荐模型架构的设计与优化,包括在线推理、离线训练及平台化工作

你将直面海量吞吐下的性能、成本与稳定性挑战,推动推荐算法的持续突破
适合对GPU底层、大规模分布式训练有深入研究的资深工程师

最低要求

扎实的编程能力,有优秀的设计和代码能力,对解决具有挑战性问题充满激情

理解GPU硬件架构、GPU软件栈(CUDA/CUTLASS、Triton Lang),具备GPU性能分析经验
深入研究过至少一种机器学习框架(Tensorflow/PyTorch或其他自研框架)的底层架构和机制

工作职责

策略架构,负责推荐在线链路的服务建设和迭代,串联请求处理全流程,解决链路延迟、吞吐瓶颈、数据的高效传递等核心问题,支持业务策略的快速和可持续迭代,不断优化系统的性能/成本/稳定性,动态逼近优化上界,提升策略ROI

模型架构,负责精粗召等推荐模型的在线推理、离线训练以及部分平台化工作,支持模型的持续复杂化演进,解决计算和存储瓶颈,突破模型复杂度X海量离在线样本X模型数量带来的巨大工程挑战,紧贴前沿框架、算法和加速硬件,支撑推荐算法的持续突破

优先资格

熟悉各类深度学习网络和算子底层实现细节

训练方向,有大规模分布式训练经验
熟悉MLIR、XLA、TVM等深度神经网络编译/优化器
能使用数学工具分析深度学习训推的优化算法

AI 洞察

优缺点分析

优点

  • 字节跳动技术氛围浓厚,GPU、分布式训练等前沿方向资源充足
  • 薪酬福利具有竞争力,且有期权等长期激励
  • 技术栈要求深,需要持续学习GPU、编译器等底层知识
  • 面对海量数据和模型,稳定性与性能的平衡需要精细设计
  • 适合热爱底层技术、对GPU优化和系统性能有极致追求的资深工程师

缺点 / 挑战

  • 核心业务场景,流量巨大,技术挑战极具吸引力,能快速积累大规模系统经验
  • 工作节奏快,业务压力大,需要承担高强度的技术攻坚

角色解读

  • 技术纵深发展:成为GPU优化或分布式推理的专家,解决行业内顶尖难题
  • 架构师路线:从模型架构扩展到整体推荐系统架构,主导技术演进
  • 管理路线:带团队负责模型架构方向,培养新人,推动业务目标达成
  • 负责抖音直播推荐模型的在线推理和离线训练系统设计与开发,确保高并发低延迟
  • 深入优化GPU计算性能,利用CUDA/CUTLASS等技术突破计算瓶颈
  • 参与推荐模型平台化建设,抽象通用组件,提升算法团队迭代效率
  • 精通C++/Python,具备高性能系统编程能力
  • 深入理解GPU硬件架构及CUDA编程,有实际性能调优经验
  • 熟悉主流深度学习框架底层机制,如TensorFlow、PyTorch

申请策略

  • 在简历中体现对推荐系统业务的了解,说明自己的技术如何支撑算法迭代
  • 面试前刷题准备系统设计与算法题,重点准备GPU相关开放性问题
  • 突出GPU性能调优项目经验,如使用CUDA加速模型推理的具体成果
  • 展示对深度学习框架底层的理解,例如修改过TensorFlow/PyTorch算子或内核
  • 强调大规模分布式训练或推理系统的设计经验,量化吞吐、延迟等指标
  • 系统学习CUDA编程和GPU架构,尝试复现并优化经典模型算子
  • 阅读TensorFlow/PyTorch源码,理解分布式训练和推理的实现细节

面试指南

  • 从问题定义入手,分析瓶颈是计算/访存/通信,再给出具体优化手段(算子融合、量化、流水线等)
  • 结合具体项目经验,量化优化前后的性能提升,展现系统性思考
  • 如何优化一个基于PyTorch的推荐模型推理速度?请从GPU和系统层面分析
  • 解释一下TensorFlow的图优化机制,你如何调试性能瓶颈?
  • 描述一次你解决GPU显存不足或通信瓶颈的经验
  • 大规模分布式训练中,同步与异步的优缺点及适用场景
  • 如何看待MLIR在模型部署中的价值?
  • 复习GPU架构(SM、显存层次、带宽)和CUDA编程模型,准备代码例子

职位点评

72
综合评分

字节核心业务,前沿GPU/分布式技术栈,薪资优厚,但工作节奏快、WLB一般。

更适合这类人
适合追求技术深度和高速成长,对薪资和福利有较高预期,能接受高强度工作的求职者。
表现最好
成长发展
相对薄弱
工作生活
薪资福利85
成长发展95
工作生活40
使命价值70

薪资福利

85较高

字节跳动提供极具竞争力的薪资和福利,但具体未在JD中披露。薪酬信号为市场水准以上,福利方面JD未提及具体项。

薪资信号未披露(AI估算:45K-75K/月)

成长发展

95较高

职位处于前沿技术领域(GPU优化、分布式训练),技术挑战大,成长空间极高。JD中虽未明确提及培训或晋升通道,但字节跳动内部有完善的晋升机制和技术分享文化。

技术前沿前沿/新兴技术
技术栈GPU、CUDA、分布式训练、深度学习框架、MLIR
业务类型profit_center

工作生活

40较低

北京现场办公,且互联网大厂核心业务通常工作节奏快,JD未提及弹性工作或WLB措施,加班可能较多。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值

70中等

直播推荐直接影响数亿用户体验和商业变现,社会影响力中性偏正向,但主要是商业驱动。行业属于高速增长的数字经济领域,创新程度高。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 多媒体处理高级开发工程师

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 招聘专家-广告

    字节跳动 · 北京市
    AI 估算 · 20k-35k
  • 自动化开发专家-TikTok(杭州/上海)

    字节跳动 · 杭州市
    AI 估算 · 35k-65k
  • AI业务研发工程师-TikTok Shop

    字节跳动 · 上海市
    AI 估算 · 25k-50k
  • 平台产品经理(游戏AI方向)-抖音

    字节跳动 · 深圳市
    AI 估算 · 25k-45k

相似职位推荐

  • Student Intern-SYNC

    西门子 · 上海市
    AI 估算 · 4k-6k
  • Advanced Software Engineer-C++

    飞利浦 · 沈阳市
    AI 估算 · 15k-25k
  • Advanced Software Engineer-C++

    飞利浦 · 沈阳市
    AI 估算 · 25k-40k
  • 2027 Campus - Software Development Engineer - Industrial & IoT

    恩智浦半导体 · 北京市
    AI 估算 · 15k-25k
  • 大模型推理部署优化实习生-AI引擎

    米哈游 · 上海市
    AI 估算 · 4k-8k

字节跳动 的其他在招职位

  • 多媒体处理高级开发工程师

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 招聘专家-广告

    字节跳动 · 北京市
    AI 估算 · 20k-35k
  • 自动化开发专家-TikTok(杭州/上海)

    字节跳动 · 杭州市
    AI 估算 · 35k-65k
  • AI业务研发工程师-TikTok Shop

    字节跳动 · 上海市
    AI 估算 · 25k-50k
  • 平台产品经理(游戏AI方向)-抖音

    字节跳动 · 深圳市
    AI 估算 · 25k-45k

相似职位推荐

  • Student Intern-SYNC

    西门子 · 上海市
    AI 估算 · 4k-6k
  • Advanced Software Engineer-C++

    飞利浦 · 沈阳市
    AI 估算 · 15k-25k
  • Advanced Software Engineer-C++

    飞利浦 · 沈阳市
    AI 估算 · 25k-40k
  • 2027 Campus - Software Development Engineer - Industrial & IoT

    恩智浦半导体 · 北京市
    AI 估算 · 15k-25k
  • 大模型推理部署优化实习生-AI引擎

    米哈游 · 上海市
    AI 估算 · 4k-8k