字节跳动的AI服务端架构师-剪映CapCut（北京/上海/深圳）薪资是多少？

该职位薪资范围为 35k–60k（人民币/月）。

AI服务端架构师-剪映CapCut（北京/上海/深圳）的工作地点在哪里？

该职位工作地点位于北京市、上海市、深圳市。工作形式为仅现场办公。

字节跳动的AI服务端架构师-剪映CapCut（北京/上海/深圳）有什么任职要求？

该职位要求本科学历及高级经验工作经验。

字节跳动

AI服务端架构师-剪映CapCut（北京/上海/深圳）

立即应聘

AI服务端架构师-剪映CapCut（北京/上海/深圳）

发布于大约 11 小时前

普通员工/个人贡献者

北京市 / 上海市

高级经验

全职员工

仅现场办公

本科

软件工程

PyTorch

GPU优化

CUDA

模型压缩

TensorRT

AIGC

diffusion

DiT

AI 估算 · 35k–60k

AI架构师在一线大厂较为稀缺，且涉及前沿AIGC技术，技能壁垒高，薪资具有较强竞争力，综合考虑取35-60K/月。

职位详情

关于这个职位

该职位负责剪映系产品AI模型的工程部署与推理加速，涉及GPU资源管理和优化

你将与Infra团队协作，提升GPU利用率，落地前沿推理加速技术

适合深耕AI推理优化、追求技术深度的工程师

最低要求

本科及以上学历，计算机相关专业

熟练掌握C++/Golang，精通数据结构与算法，有并发编程基础

有服务端工程研发和维护经验，有较好的服务端架构优化经验

具备扎实的GPU编程基础，包括CUDA，Trtion，Cutlass等，熟悉大模型网络架构和和算子实现细节，有丰富的模型和算子性能调优实战经验

具有Diffusion/DiT类AIGC模型的工程化和推理加速经验，熟悉PyTorch，熟悉xDiT/LightX2V等DiT推理框架及常用DiT推理加速技术

熟悉大模型的模型量化、剪枝、蒸馏等模型压缩技术

工作职责

参与剪映系产品涉及的关键算法模型的工程部署和推理优化，落地行业中一些推理加速方法、工具等

参与剪映系GPU资源优化，建设GPU管理系统在不同Infra平台上管理不同模型的GPU资源，与Infra团队协作，提升整体剪映系GPU利用率

优先资格

熟悉PyTorch/TensorFlow或其他主流深度学习技术框架

具有AIGC模型训练/推理优化经验，熟悉TensorRT-LLM、VLLM等LLM推理效率优化工具者优先

AI 洞察

优缺点分析

优点

字节跳动大平台，剪映产品增长迅速，技术影响力广泛
涉及前沿AIGC技术，紧跟行业热点，技能稀缺性强
GPU优化方向人才需求旺盛，职业发展空间大
薪资福利在行业内具有显著竞争力
技术深度要求高，需持续学习最新推理优化方法
领域竞争激烈，需要不断产出可落地的优化成果

缺点 / 挑战

互联网大厂工作节奏快，可能需要应对高强度项目压力
适合对AI推理优化有浓厚兴趣、乐于挑战技术难题、希望在大厂快节奏环境中快速成长的工程师

角色解读

技术专家路线：深耕GPU底层优化，成为AI推理加速领域权威
架构师路线：横向扩展至AI平台架构，负责更大规模的系统设计
可转向AI框架研发或AI Infra方向，拓宽技术广度
负责剪映系产品AI模型的工程部署与推理加速，落地CUDA/TensorRT等优化技术
建设GPU资源管理系统，在不同Infra平台上管理模型GPU资源，提升整体利用率
参与模型量化、剪枝、蒸馏等压缩技术的研究与应用，降低模型部署成本
与Infra团队协作，优化GPU调度方案，支撑业务高效迭代
精通C++/Golang和数据结构算法，具备服务端架构设计能力
扎实的GPU编程基础，熟悉CUDA、TensorRT、Cutlass等，能进行算子级性能调优
深入理解Diffusion/DiT等AIGC模型架构，具备推理加速实战经验
熟悉模型压缩技术（量化、剪枝、蒸馏），了解PyTorch等框架

申请策略

了解字节跳动剪映的业务方向和AI技术栈，在面试中展示对产品技术痛点的理解
准备一个完整的系统设计案例，涵盖模型部署、推理优化和资源管理
突出GPU编程和性能调优项目经验，如CUDA kernel优化、TensorRT部署案例
强调AIGC模型（如Diffusion）部署与加速的实际成果，包括延迟、吞吐提升数据
展示服务端架构设计经验，如高并发、资源调度系统
如有模型压缩（量化、剪枝）经验，务必详细描述方法及收益
补充TensorRT-LLM或vLLM等LLM推理框架的使用经验
熟悉更多DiT推理框架（如xDiT、LightX2V）及加速技术

面试指南

对于优化类问题，采用“问题定位→技术选型→实现细节→效果评估”四步法
对于系统设计类问题，使用“需求分析→架构设计→关键组件→权衡与优化”框架
对于项目经验类问题，采用STAR（情境、任务、行动、结果）方法清晰描述
如何优化一个Diffusion模型的推理速度？请从模型、算子、系统层面分别说明
设计一个GPU资源管理系统，支持多模型动态调度
介绍一个你参与过的模型压缩项目，包括方法、效果和挑战
在服务端架构中，如何保证高可用和低延迟？
CUDA编程中，如何优化内存访问模式以提高性能？

职位点评

综合评分

大厂AI架构师，前沿AIGC技术栈，高薪但WLB一般，适合技术驱动型人才。

更适合这类人

最适合追求技术成长和高薪回报的求职者，愿意在快节奏中深耕AI推理优化。

表现最好

成长发展

相对薄弱

工作生活

薪资福利85

成长发展90

工作生活40

使命价值70

薪资福利

85较高

字节跳动作为一线大厂，薪资福利在行业内处于领先地位，但JD未明确具体数字；岗位级别高，薪酬具备竞争力。

薪资信号未披露（AI估算：35K-60K/月）

成长发展

90较高

涉及AIGC前沿技术，GPU优化和模型压缩方向技能稀缺，成长空间大。但JD未明确提及内部培训或晋升机制。

技术前沿前沿/新兴技术

技术栈C++、Golang、CUDA、PyTorch、Diffusion、DiT、TensorRT、模型量化、剪枝、蒸馏

业务类型profit_center

工作生活

40较低

职位要求在多地现场办公，未提及远程或弹性工作，大厂普遍存在一定加班文化，WLB保障不明确。

工作模式仅现场办公

办公地点科技园/产业园

加班情况未提及（无法判断）

使命价值

70中等

AIGC行业高速增长，剪映产品用户规模大，但社会影响力偏中性；岗位创新性强，采用前沿技术。

行业发展高速增长赛道

社会影响中性/一般

创新程度积极采用新技术

字节跳动的其他在招职位

相似职位推荐

Watch Jobs

AI服务端架构师-剪映CapCut（北京/上海/深圳）

职位详情

关于这个职位

最低要求

工作职责

优先资格

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

多媒体处理高级开发工程师

招聘专家-广告

自动化开发专家-TikTok（杭州/上海）

AI业务研发工程师-TikTok Shop

平台产品经理（游戏AI方向）-抖音

Student Intern-SYNC

Advanced Software Engineer-C++

Advanced Software Engineer-C++

2027 Campus - Software Development Engineer - Industrial & IoT

大模型推理部署优化实习生-AI引擎

字节跳动的其他在招职位

多媒体处理高级开发工程师

招聘专家-广告

自动化开发专家-TikTok（杭州/上海）

AI业务研发工程师-TikTok Shop

平台产品经理（游戏AI方向）-抖音

相似职位推荐

Student Intern-SYNC

Advanced Software Engineer-C++

Advanced Software Engineer-C++

2027 Campus - Software Development Engineer - Industrial & IoT

大模型推理部署优化实习生-AI引擎

AI服务端架构师-剪映CapCut（北京/上海/深圳）

职位详情

关于这个职位

最低要求

工作职责

优先资格

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

字节跳动 的其他在招职位

多媒体处理高级开发工程师

招聘专家-广告

自动化开发专家-TikTok（杭州/上海）

AI业务研发工程师-TikTok Shop

平台产品经理（游戏AI方向）-抖音

相似职位推荐

Student Intern-SYNC

Advanced Software Engineer-C++

Advanced Software Engineer-C++

2027 Campus - Software Development Engineer - Industrial & IoT

大模型推理部署优化实习生-AI引擎

字节跳动的其他在招职位