ByteDance logo
字节跳动
AI服务端架构师-剪映CapCut(北京/上海/深圳)

AI服务端架构师-剪映CapCut(北京/上海/深圳)

发布于 大约 11 小时前

普通员工/个人贡献者

北京市 / 上海市
高级经验
全职员工
仅现场办公
本科
软件工程
PyTorch
GPU优化
CUDA
模型压缩
TensorRT
AIGC
diffusion
DiT

AI 估算 · 35k–60k

AI架构师在一线大厂较为稀缺,且涉及前沿AIGC技术,技能壁垒高,薪资具有较强竞争力,综合考虑取35-60K/月。

职位详情

关于这个职位

该职位负责剪映系产品AI模型的工程部署与推理加速,涉及GPU资源管理和优化

你将与Infra团队协作,提升GPU利用率,落地前沿推理加速技术
适合深耕AI推理优化、追求技术深度的工程师

最低要求

本科及以上学历,计算机相关专业

熟练掌握C++/Golang,精通数据结构与算法,有并发编程基础
有服务端工程研发和维护经验,有较好的服务端架构优化经验
具备扎实的GPU编程基础,包括CUDA,Trtion,Cutlass等,熟悉大模型网络架构和和算子实现细节,有丰富的模型和算子性能调优实战经验
具有Diffusion/DiT类AIGC模型的工程化和推理加速经验,熟悉PyTorch,熟悉xDiT/LightX2V等DiT推理框架及常用DiT推理加速技术
熟悉大模型的模型量化、剪枝、蒸馏等模型压缩技术

工作职责

参与剪映系产品涉及的关键算法模型的工程部署和推理优化,落地行业中一些推理加速方法、工具等

参与剪映系GPU资源优化,建设GPU管理系统在不同Infra平台上管理不同模型的GPU资源,与Infra团队协作,提升整体剪映系GPU利用率

优先资格

熟悉PyTorch/TensorFlow或其他主流深度学习技术框架

具有AIGC模型训练/推理优化经验,熟悉TensorRT-LLM、VLLM等LLM推理效率优化工具者优先

AI 洞察

优缺点分析

优点

  • 字节跳动大平台,剪映产品增长迅速,技术影响力广泛
  • 涉及前沿AIGC技术,紧跟行业热点,技能稀缺性强
  • GPU优化方向人才需求旺盛,职业发展空间大
  • 薪资福利在行业内具有显著竞争力
  • 技术深度要求高,需持续学习最新推理优化方法
  • 领域竞争激烈,需要不断产出可落地的优化成果

缺点 / 挑战

  • 互联网大厂工作节奏快,可能需要应对高强度项目压力
  • 适合对AI推理优化有浓厚兴趣、乐于挑战技术难题、希望在大厂快节奏环境中快速成长的工程师

角色解读

  • 技术专家路线:深耕GPU底层优化,成为AI推理加速领域权威
  • 架构师路线:横向扩展至AI平台架构,负责更大规模的系统设计
  • 可转向AI框架研发或AI Infra方向,拓宽技术广度
  • 负责剪映系产品AI模型的工程部署与推理加速,落地CUDA/TensorRT等优化技术
  • 建设GPU资源管理系统,在不同Infra平台上管理模型GPU资源,提升整体利用率
  • 参与模型量化、剪枝、蒸馏等压缩技术的研究与应用,降低模型部署成本
  • 与Infra团队协作,优化GPU调度方案,支撑业务高效迭代
  • 精通C++/Golang和数据结构算法,具备服务端架构设计能力
  • 扎实的GPU编程基础,熟悉CUDA、TensorRT、Cutlass等,能进行算子级性能调优
  • 深入理解Diffusion/DiT等AIGC模型架构,具备推理加速实战经验
  • 熟悉模型压缩技术(量化、剪枝、蒸馏),了解PyTorch等框架

申请策略

  • 了解字节跳动剪映的业务方向和AI技术栈,在面试中展示对产品技术痛点的理解
  • 准备一个完整的系统设计案例,涵盖模型部署、推理优化和资源管理
  • 突出GPU编程和性能调优项目经验,如CUDA kernel优化、TensorRT部署案例
  • 强调AIGC模型(如Diffusion)部署与加速的实际成果,包括延迟、吞吐提升数据
  • 展示服务端架构设计经验,如高并发、资源调度系统
  • 如有模型压缩(量化、剪枝)经验,务必详细描述方法及收益
  • 补充TensorRT-LLM或vLLM等LLM推理框架的使用经验
  • 熟悉更多DiT推理框架(如xDiT、LightX2V)及加速技术

面试指南

  • 对于优化类问题,采用“问题定位→技术选型→实现细节→效果评估”四步法
  • 对于系统设计类问题,使用“需求分析→架构设计→关键组件→权衡与优化”框架
  • 对于项目经验类问题,采用STAR(情境、任务、行动、结果)方法清晰描述
  • 如何优化一个Diffusion模型的推理速度?请从模型、算子、系统层面分别说明
  • 设计一个GPU资源管理系统,支持多模型动态调度
  • 介绍一个你参与过的模型压缩项目,包括方法、效果和挑战
  • 在服务端架构中,如何保证高可用和低延迟?
  • CUDA编程中,如何优化内存访问模式以提高性能?

职位点评

71
综合评分

大厂AI架构师,前沿AIGC技术栈,高薪但WLB一般,适合技术驱动型人才。

更适合这类人
最适合追求技术成长和高薪回报的求职者,愿意在快节奏中深耕AI推理优化。
表现最好
成长发展
相对薄弱
工作生活
薪资福利85
成长发展90
工作生活40
使命价值70

薪资福利

85较高

字节跳动作为一线大厂,薪资福利在行业内处于领先地位,但JD未明确具体数字;岗位级别高,薪酬具备竞争力。

薪资信号未披露(AI估算:35K-60K/月)

成长发展

90较高

涉及AIGC前沿技术,GPU优化和模型压缩方向技能稀缺,成长空间大。但JD未明确提及内部培训或晋升机制。

技术前沿前沿/新兴技术
技术栈C++、Golang、CUDA、PyTorch、Diffusion、DiT、TensorRT、模型量化、剪枝、蒸馏
业务类型profit_center

工作生活

40较低

职位要求在多地现场办公,未提及远程或弹性工作,大厂普遍存在一定加班文化,WLB保障不明确。

工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值

70中等

AIGC行业高速增长,剪映产品用户规模大,但社会影响力偏中性;岗位创新性强,采用前沿技术。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs