Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
模型架构工程师-抖音电商
立即应聘

模型架构工程师-抖音电商

发布于 1 天前

普通员工/个人贡献者

深圳市
高级经验
全职员工
仅现场办公
学历未注明
GPU
PyTorch
TensorFlow
XLA
CUDA
量化
模型剪枝
MLIR
分布式训练

AI 估算 · 35k–65k

字节跳动电商核心岗位,GPU/模型工程方向稀缺,薪资竞争力强,结合深圳市场行情估算。

职位详情

关于这个职位

该职位负责抖音电商场景下大规模机器学习模型推理与训练系统的研发,涉及GPU性能优化、深度学习框架底层架构及模型压缩等前沿技术

你将与推荐算法团队紧密合作,解决计算和存储瓶颈,提升模型效率,直接支撑字节跳动核心电商业务的增长

最低要求

熟练掌握Linux环境下的C/C++编程

理解GPU硬件架构、GPU软件栈(CUDA/CUTLASS、Triton Lang),具备GPU性能分析经验
深入研究过至少一种机器学习框架(TensorFlow/PyTorch或其他自研框架)的底层架构和机制
熟悉模型剪枝、量化及压缩、算子融合等方法

工作职责

参与大规模机器学习在线预估和离线训练系统的研发与优化,支撑今日头条、抖音等字节跳动旗下电商场景高效模型推理

紧贴前沿框架和社区工作,支持模型的持续复杂化演进,解决计算和存储瓶颈,突破模型复杂度X海量离在线样本X模型数量带来的巨大工程挑战
参与大规模特征及样本的处理与流转、模型训练与调度等相关问题的研究与突破
与推荐算法同学紧密合作,分析并解决上述问题及任务,并应用到实际业务中

优先资格

熟悉各类深度学习网络和算子底层实现细节

有分布式训练经验
熟悉MLIR、XLA、TVM等深度神经网络编译/优化器

AI 洞察

优缺点分析

优点

  • 团队技术氛围浓厚,紧跟CUDA/Triton等前沿技术,个人技术成长迅速
  • 薪资福利优厚,股票期权具有长期价值
  • 工作强度较大,需要应对海量数据和复杂业务的高要求
  • 技术栈深度高,需要持续学习GPU、编译器等底层知识
  • 推荐与工程紧密结合,需要较强的跨团队沟通能力
  • 适合对GPU优化、模型部署有浓厚兴趣,具备较强系统编程能力,希望在互联网核心业务中实现技术突破的资深工程师

缺点 / 挑战

  • 字节跳动核心电商业务,数据量大,技术挑战高,能积累业界顶尖的模型工程经验

角色解读

  • 技术方向:从GPU优化专家到系统架构师,负责更复杂的分布式训练系统
  • 业务方向:深入理解电商推荐业务,成为算法工程复合型人才
  • 管理方向:带领模型工程团队,主导技术选型和架构演进
  • 负责抖音电商场景下大规模模型推理系统的研发,优化在线预估和离线训练流程
  • 解决GPU计算和存储瓶颈,通过模型剪枝、量化等技术提升效率
  • 与推荐算法团队合作,将模型工程能力落地到实际业务中
  • 精通C/C++和Linux环境,具备系统级编程能力
  • 深入理解GPU架构和CUDA编程,有性能分析优化经验
  • 熟悉TensorFlow或PyTorch等框架底层机制,能进行定制优化

申请策略

  • 在简历中附上GitHub链接或技术博客,展示对底层技术的探索
  • 准备一个最复杂的性能优化案例,能清晰讲述问题、方案和收益
  • 重点突出GPU性能优化项目经验,如CUDA kernel调优、内存带宽优化等
  • 展示对TensorFlow/PyTorch框架的源码级理解或贡献经历
  • 强调模型压缩、量化、剪枝等实际落地案例及效果
  • 提前阅读NVIDIA官方CUDA文档及最新CUTLASS实现
  • 学习MLIR/TVM等编译技术,了解端侧和云端部署优化
  • 复习分布式训练原理,如数据并行、模型并行、参数服务器

面试指南

  • STAR法则:Situation-Task-Action-Result,突出技术难点和量化收益
  • 对比多种方案,说明为什么选择某种实现,体现技术判断力
  • 结合字节场景:考虑海量数据和高并发,强调稳定性和可扩展性
  • 请描述一次你通过CUDA优化实现大幅性能提升的经历
  • TensorFlow/PyTorch中你如何实现自定义算子并保证高效?
  • 模型量化有哪些方法?如何平衡精度和速度?
  • 分布式训练中常见的通信瓶颈是什么?如何解决?
  • 复习CUDA内存层次、线程束调度等概念,准备手写kernel

匹配度报告

72
综合匹配度

大厂核心业务、前沿GPU技术、高薪但高强度,适合技术驱动型人才。

适合人群
适合极度追求技术成长和薪资回报,愿意接受一定工作强度的资深工程师。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展95
工作生活40
使命价值70

薪资福利匹配

85较高

字节跳动薪资竞争力强,股票期权丰厚,且为上市大厂,稳定性较高。但JD未明确薪资范围,面议可能。

薪资信号面议 (35K-65K/月)

成长发展匹配

95较高

职位涉及GPU、模型压缩、分布式训练等前沿技术,且与业务紧密结合,成长空间大。JD未明确提及晋升,但字节内部技术晋升体系完善。

技术前沿前沿/新兴技术
技术栈CUDA、TensorFlow、PyTorch、MLIR、XLA、TVM、模型剪枝、量化
业务类型profit_center

工作生活匹配

40较低

字节跳动工作强度较高,JD未提及WLB,且为现场办公,深圳科技园区域。

工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值匹配

70中等

电商行业稳定增长,但社会影响力属中性。JD未提及使命或社会价值。

行业发展稳定成熟行业
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • AI平台研发工程师-集团信息系统

    字节跳动 · 深圳市
    AI 估算 · 25k-45k
  • 国际业务内容商务拓展专家-Dola

    字节跳动 · 北京市
    AI 估算 · 35k-65k
  • 商业化营销策略专家-抖音生活服务

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • HRBP-中国公共职能(北京)

    字节跳动 · 北京市
    AI 估算 · 20k-30k
  • 产品经理(导航/路线/路况)-地理位置中台

    字节跳动 · 北京市
    AI 估算 · 25k-40k

相似职位推荐

  • Java开发工程师(联盟) - 【商业化】

    快手 · 北京市
    AI 估算 · 18k-28k
  • 后端AI Agent 工程师

    中国平安 · 深圳市
    AI 估算 · 20k-40k

字节跳动 的其他在招职位

  • AI平台研发工程师-集团信息系统

    字节跳动 · 深圳市
    AI 估算 · 25k-45k
  • 国际业务内容商务拓展专家-Dola

    字节跳动 · 北京市
    AI 估算 · 35k-65k
  • 商业化营销策略专家-抖音生活服务

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • HRBP-中国公共职能(北京)

    字节跳动 · 北京市
    AI 估算 · 20k-30k
  • 产品经理(导航/路线/路况)-地理位置中台

    字节跳动 · 北京市
    AI 估算 · 25k-40k

相似职位推荐

  • Java开发工程师(联盟) - 【商业化】

    快手 · 北京市
    AI 估算 · 18k-28k
  • 后端AI Agent 工程师

    中国平安 · 深圳市
    AI 估算 · 20k-40k