ByteDance logo
字节跳动
具身智能推理性能优化工程师-Seed

具身智能推理性能优化工程师-Seed

发布于 大约 9 小时前

普通员工/个人贡献者

北京市
高级经验
全职员工
仅现场办公
本科
深度学习
CUDA
量化
GPU性能优化
cuDNN
蒸馏
vLLM
TensorRT-LLM
算子融合
具身智能

AI 估算 · 30k–60k

字节跳动是头部互联网公司,北京高级AI工程师薪资较高,且该职位要求GPU优化等稀缺技能,竞争力强。

职位详情

关于这个职位

该职位负责具身智能模型在云端和端侧的推理性能优化,通过量化、剪枝、算子融合等技术手段提升GPU性能,并与算法团队深度合作进行联合优化

适合对AI工程优化有热情、精通C++和CUDA的工程师

最低要求

本科及以上学历,计算机/电子/自动化/软件等相关专业,有AI工程优化经验的优先

精通C/C++,精通算法与数据结构,熟悉Python
了解深度学习算法基本原理,熟悉神经网络基本架构和各算子计算方式,了解至少一种深度学习训练框架
熟练使用GPU或NPU高性能编程技术为模型训练或推理加速,例如:CUDA、CUDNN、CUTLASS、Triton等

工作职责

负责具身智能相关模型云侧和端侧模型的性能优化和部署

运用性能分析工具,对模型推理过程进行性能剖析,定位性能瓶颈,提出有效的优化方案,并通过实验验证优化效果
通过量化、剪枝、蒸馏、算子融合、Cuda算子编写等性能优化的手段,结合业务需求,将GPU性能发挥到极致
与算法部门深度合作,进行算法与系统的联合优化

优先资格

)具备自动驾驶或机器人业务背景,有NVIDIA Jetson开发经验

)熟悉大模型量化或蒸馏技术,例如:SmoothQuant、GPTQ、LCM、LCM-LoRA等
)熟练使用开源推理加速工具为模型加速,例如:TensorRT-LLM、vLLM、TVM、Torch.Compile等,并理解其优化原理

AI 洞察

优缺点分析

优点

  • 字节跳动平台大,资源充足,技术氛围浓厚
  • 具身智能是前沿赛道,技术积累有长期价值
  • 薪资福利优厚,年终奖和股票收益可观
  • 技术迭代快,需要持续学习新框架和工具
  • 对性能极致要求,可能需要调试底层硬件细节

缺点 / 挑战

  • 工作强度和压力较大,可能需要应对紧急项目
  • 适合对AI工程优化有强烈兴趣,喜欢挑战极限性能,并愿意在高压环境下快速成长的工程师

角色解读

  • 技术方向:成为AI系统优化专家,主导大模型推理引擎研发
  • 管理方向:带领团队负责整体AI工程化落地
  • 跨领域:转向具身智能算法或自动驾驶感知算法
  • 负责具身智能模型的推理性能优化,包括云端和端侧部署
  • 使用性能分析工具定位瓶颈,通过量化、剪枝、算子融合等手段提升GPU利用率
  • 编写CUDA算子优化关键计算,与算法团队协作实现系统级加速
  • 精通C/C++和Python,熟悉算法与数据结构
  • 深入理解深度学习原理与神经网络架构,熟悉训练框架
  • 熟练使用CUDA、CUDNN等GPU编程技术进行模型加速

申请策略

  • 了解字节跳动Seed团队的产品方向,面试中展示业务理解
  • 准备一个完整的性能优化案例,从分析到落地的过程
  • 突出GPU优化项目经验,量化/蒸馏/算子融合实际案例
  • 强调C++和CUDA编程能力,可附上GitHub代码仓库
  • 写明具身智能、自动驾驶或机器人相关背景
  • 提前学习TensorRT-LLM、vLLM等推理加速框架
  • 补充经典量化和蒸馏论文(SmoothQuant、GPTQ等)

面试指南

  • 对于技术问题,先明确问题边界,再分步骤讲解优化方案
  • 对于项目经历,使用STAR法则(情境-任务-行动-结果)陈述
  • 对于开放性问题,结合实际案例,展示解决思路和量化效果
  • 如何对Transformer模型进行量化?你了解哪些量化方法?
  • 请解释CUDA中的共享内存和全局内存优化策略
  • 描述一次你如何定位并解决模型推理瓶颈的经历
  • 了解TensorRT-LLM吗?其工作原理是什么?
  • 复习深度学习推理优化经典论文和主流工具

匹配度报告

71
综合匹配度

字节跳动具身智能推理优化岗,前沿技术栈,高薪高压,发展空间大。

适合人群
适合重视技术成长和薪资回报,能接受高强度工作的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展90
工作生活40
使命价值70

薪资福利匹配

85较高

字节跳动薪资水平位于行业头部,福利完善,但工作强度较高,整体补偿性动机满足良好。

薪资信号未披露(AI估算:30K-60K/月)

成长发展匹配

90较高

职位涉及具身智能前沿技术和GPU性能优化,技术成长空间大,且字节跳动内部技术分享丰富。

技术前沿前沿/新兴技术
技术栈CUDA、量化、蒸馏、TensorRT-LLM、vLLM、Triton、具身智能
业务类型profit_center

工作生活匹配

40较低

字节跳动通常工作节奏快,加班可能较多,且仅现场办公,生活化动机满足较低。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

70中等

具身智能是高速增长赛道,对社会有潜在正向影响,但职位更偏工程实现而非直接社会价值。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs