Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
推理GPU性能优化专家-Seed
立即应聘

推理GPU性能优化专家-Seed

发布于 大约 9 小时前

普通员工/个人贡献者

北京市
高级经验
全职员工
仅现场办公
本科
GPU
深度学习
PyTorch
LLM
CUDA
大模型
vLLM
TensorRT-LLM

AI 估算 · 35k–65k

字节跳动大模型核心团队,对GPU优化专家需求迫切,薪资竞争力强,但工作强度高,综合月薪约35-65K。

职位详情

关于这个职位

该职位负责字节跳动核心大模型推理框架的GPU性能优化,通过CUDA等底层技术打造高性能LLM推理引擎,与算法团队深度合作

适合拥有扎实C++/CUDA经验、追求极致性能的AI系统工程师

最低要求

本科及以上学历,计算机/电子/自动化/软件等相关专业,有AI工程优化经验的优先

精通C/C++,精通算法与数据结构,熟悉Python
熟练GPU的高性能计算优化技术,深入理解计算机体系结构,熟悉并行计算优化、访存优化,低比特计算等
具备丰富的基于CUDA的GPU性能优化经验
了解深度学习算法基本原理,熟悉神经网络基本架构和各算子计算方式,了解至少一种深度学习训练框架及其模型文件的解析,如PyTorch、TensorFlow

工作职责

负责开发和优化字节跳动公司级的大模型推理框架

主要通过GPU、CUDA性能优化的手段,结合线上实际情况,打造业界领先的高性能LLM推理引擎
负责机器学习系统前瞻技术的调研和引入
与算法部门深度合作,进行算法与系统的联合优化

优先资格

熟悉TensorRT-LLM、ORCA、vLLM等,了解主流LLM模型,有LLM模型加速优化经验者优先

AI 洞察

优缺点分析

优点

  • 处于AI大模型最前沿,参与公司级核心推理框架研发,技术影响力巨大
  • 字节跳动平台资源丰富,数据量大,能接触到业界最大的模型部署场景
  • 薪资和激励丰厚,且团队氛围技术导向,成长空间大
  • GPU优化是AI基础设施的核心技能,积累后可迁移至任何AI公司
  • 大模型领域快速迭代,需要紧跟学术界和工业界最新进展
  • 适合热爱底层系统优化、对性能有极致追求、技术自驱力强且能接受高强度工作的AI系统工程师

缺点 / 挑战

  • 工作强度较高,需要应对线上实时性能问题和紧迫的业务需求
  • 技术门槛高,需要同时精通硬件、系统软件和深度学习,持续学习压力大

角色解读

  • 技术深耕:成为GPU性能优化领域的专家,主导AI基础设施架构演进
  • 系统架构:从单一推理优化扩展到AI全链路系统设计,成为AI系统架构师
  • 技术管理:积累丰富经验后可转向团队管理,带领优化团队突破性能瓶颈
  • 负责字节跳动大模型推理框架的开发和优化,主要通过GPU/CUDA进行性能调优
  • 结合线上实际负载,打造业界领先的高性能LLM推理引擎,降低延迟和成本
  • 与算法团队紧密合作,从系统与算法联合优化的角度提升模型推理效率
  • 调研和引入机器学习系统前沿技术,保持框架的先进性
  • 精通C/C++和Python,具备扎实的数据结构和算法基础
  • 深入理解GPU架构,精通CUDA高性能计算优化,包括并行计算、访存优化、低比特计算等
  • 了解深度学习基本原理,熟悉神经网络算子,能解析PyTorch/TensorFlow模型文件
  • 熟悉LLM推理引擎如TensorRT-LLM、vLLM,有大模型加速经验者优先

申请策略

  • 字节跳动非常看重项目落地效果,请在简历中用量化数据(如吞吐提升X倍)展示你的贡献
  • 面试前了解Seed团队的公开技术博客和会议演讲,展示你对团队研究方向的理解
  • 重点突出GPU/CUDA性能优化项目,详细描述你如何通过优化计算或访存达到显著加速
  • 展示C++和Python的系统编程能力,包括项目中的关键优化技巧和成果
  • 如果有LLM推理或TensorRT-LLM使用经验,务必列出具体优化指标(如延迟降低百分比)
  • 强调与算法团队合作的经验,体现跨团队协作能力
  • 深入阅读CUDA官方文档和优化指南,掌握shared memory、warp shuffle等高级技巧
  • 动手实践基于vLLM或TensorRT-LLM部署LLM,并尝试做性能调优

面试指南

  • 对于优化类问题:先明确瓶颈(计算/访存),采用对应的优化策略(如减少全局内存访问、使用寄存器等),最后用profiling工具验证效果
  • 对于项目描述类问题:使用STAR法则(情境-任务-行动-结果),突出量化成果和你的独特贡献
  • 请解释GPU中warp和block的映射关系,以及如何通过调整grid/block大小优化性能
  • 如何优化一个CUDA Kernel的访存?请举例说明shared memory、coalesced access等策略
  • 描述你过去优化一个深度学习模型推理性能的具体案例,包括优化方法和效果
  • 了解哪些LLM推理加速技术?如KV Cache优化、continuous batching等
  • 如何实现一个高效的softmax kernel?请说明设计思路
  • 复习CUDA编程模型和GPU体系结构,熟练掌握性能分析工具(nsys、ncu)

匹配度报告

74
综合匹配度

大厂核心团队、前沿技术栈、高薪资但WLB较差,适合技术驱动型人才。

适合人群
最适合强烈追求技术成长和职业发展的求职者,愿意在AI系统优化领域深耕,且能接受较高工作强度。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利82
成长发展95
工作生活40
使命价值80

薪资福利匹配

82较高

字节跳动薪资位于行业第一梯队,该职位预期月薪35-65K,年终奖金丰厚,且有股票期权激励,但工作强度大,福利方面JD未具体说明。

薪资信号面议 (35K-65K/月)

成长发展匹配

95较高

该职位处于AI大模型最前沿,技术栈采用CUDA、TensorRT-LLM等主流高性能工具,涉及LLM推理优化,成长空间极大,且团队鼓励技术探索。

技术前沿前沿/新兴技术
技术栈GPU、CUDA、大模型、LLM、TensorRT-LLM、vLLM、PyTorch
业务类型profit_center

工作生活匹配

40较低

工作地点为北京,仅现场办公,未提及弹性工作或远程,且字节跳动通常工作强度较大,WLB一般。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值匹配

80较高

参与通用智能最前沿的研发,对科技和社会有深远影响,但使命感信号未在JD中明确体现。

行业发展高速增长赛道
社会影响正向社会影响力较高
使命信号致力于寻找通用智能的新方法,追求智能上限,为科技和社会发展作出贡献
创新程度开拓性创新(行业首创)
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 服务器整机结构工程师-Data

    字节跳动 · 杭州市
    AI 估算 · 25k-45k
  • 内容营销经理(飞书AI/Agent方向)-飞书

    字节跳动 · 上海市
    AI 估算 · 20k-35k
  • 游戏动作设计组长/专家

    字节跳动 · 深圳市
    AI 估算 · 25k-40k
  • 后端研发工程师-客服平台(成都)

    字节跳动 · 成都市
    AI 估算 · 20k-35k
  • 内容分发策略产品-红果短剧

    字节跳动 · 北京市
    AI 估算 · 20k-35k

相似职位推荐

  • Associate Director, Structured Credit Trading

    渣打银行 · 上海市
    AI 估算 · 30k-60k
  • 内容审核Agent运营

    京东 · 北京市
    AI 估算 · 20k-30k
  • 本地化策划

    完美世界 · 苏州市
    AI 估算 · 8k-15k
  • 债券交易岗

    中国平安 · 深圳市
    AI 估算 · 18k-30k
  • Senior Officer, Sustainability

    怡和洋行 · 香港特别行政区
    AI 估算 · 27k-54k

字节跳动 的其他在招职位

  • 服务器整机结构工程师-Data

    字节跳动 · 杭州市
    AI 估算 · 25k-45k
  • 内容营销经理(飞书AI/Agent方向)-飞书

    字节跳动 · 上海市
    AI 估算 · 20k-35k
  • 游戏动作设计组长/专家

    字节跳动 · 深圳市
    AI 估算 · 25k-40k
  • 后端研发工程师-客服平台(成都)

    字节跳动 · 成都市
    AI 估算 · 20k-35k
  • 内容分发策略产品-红果短剧

    字节跳动 · 北京市
    AI 估算 · 20k-35k

相似职位推荐

  • Associate Director, Structured Credit Trading

    渣打银行 · 上海市
    AI 估算 · 30k-60k
  • 内容审核Agent运营

    京东 · 北京市
    AI 估算 · 20k-30k
  • 本地化策划

    完美世界 · 苏州市
    AI 估算 · 8k-15k
  • 债券交易岗

    中国平安 · 深圳市
    AI 估算 · 18k-30k
  • Senior Officer, Sustainability

    怡和洋行 · 香港特别行政区
    AI 估算 · 27k-54k