
字节跳动
AI服务端架构师-剪映CapCut(北京/上海/深圳)
AI服务端架构师-剪映CapCut(北京/上海/深圳)
发布于 大约 11 小时前普通员工/个人贡献者
北京市 / 上海市
高级经验
全职员工
仅现场办公
本科
软件工程
PyTorch
GPU优化
CUDA
模型压缩
TensorRT
AIGC
diffusion
DiT
AI 估算 · 35k–60k
AI架构师在一线大厂较为稀缺,且涉及前沿AIGC技术,技能壁垒高,薪资具有较强竞争力,综合考虑取35-60K/月。
职位详情
关于这个职位
该职位负责剪映系产品AI模型的工程部署与推理加速,涉及GPU资源管理和优化
你将与Infra团队协作,提升GPU利用率,落地前沿推理加速技术
适合深耕AI推理优化、追求技术深度的工程师
最低要求
本科及以上学历,计算机相关专业
熟练掌握C++/Golang,精通数据结构与算法,有并发编程基础
有服务端工程研发和维护经验,有较好的服务端架构优化经验
具备扎实的GPU编程基础,包括CUDA,Trtion,Cutlass等,熟悉大模型网络架构和和算子实现细节,有丰富的模型和算子性能调优实战经验
具有Diffusion/DiT类AIGC模型的工程化和推理加速经验,熟悉PyTorch,熟悉xDiT/LightX2V等DiT推理框架及常用DiT推理加速技术
熟悉大模型的模型量化、剪枝、蒸馏等模型压缩技术
工作职责
参与剪映系产品涉及的关键算法模型的工程部署和推理优化,落地行业中一些推理加速方法、工具等
参与剪映系GPU资源优化,建设GPU管理系统在不同Infra平台上管理不同模型的GPU资源,与Infra团队协作,提升整体剪映系GPU利用率
优先资格
熟悉PyTorch/TensorFlow或其他主流深度学习技术框架
具有AIGC模型训练/推理优化经验,熟悉TensorRT-LLM、VLLM等LLM推理效率优化工具者优先
AI 洞察
优缺点分析
优点
- 字节跳动大平台,剪映产品增长迅速,技术影响力广泛
- 涉及前沿AIGC技术,紧跟行业热点,技能稀缺性强
- GPU优化方向人才需求旺盛,职业发展空间大
- 薪资福利在行业内具有显著竞争力
- 技术深度要求高,需持续学习最新推理优化方法
- 领域竞争激烈,需要不断产出可落地的优化成果
缺点 / 挑战
- 互联网大厂工作节奏快,可能需要应对高强度项目压力
- 适合对AI推理优化有浓厚兴趣、乐于挑战技术难题、希望在大厂快节奏环境中快速成长的工程师
角色解读
- 技术专家路线:深耕GPU底层优化,成为AI推理加速领域权威
- 架构师路线:横向扩展至AI平台架构,负责更大规模的系统设计
- 可转向AI框架研发或AI Infra方向,拓宽技术广度
- 负责剪映系产品AI模型的工程部署与推理加速,落地CUDA/TensorRT等优化技术
- 建设GPU资源管理系统,在不同Infra平台上管理模型GPU资源,提升整体利用率
- 参与模型量化、剪枝、蒸馏等压缩技术的研究与应用,降低模型部署成本
- 与Infra团队协作,优化GPU调度方案,支撑业务高效迭代
- 精通C++/Golang和数据结构算法,具备服务端架构设计能力
- 扎实的GPU编程基础,熟悉CUDA、TensorRT、Cutlass等,能进行算子级性能调优
- 深入理解Diffusion/DiT等AIGC模型架构,具备推理加速实战经验
- 熟悉模型压缩技术(量化、剪枝、蒸馏),了解PyTorch等框架
申请策略
- 了解字节跳动剪映的业务方向和AI技术栈,在面试中展示对产品技术痛点的理解
- 准备一个完整的系统设计案例,涵盖模型部署、推理优化和资源管理
- 突出GPU编程和性能调优项目经验,如CUDA kernel优化、TensorRT部署案例
- 强调AIGC模型(如Diffusion)部署与加速的实际成果,包括延迟、吞吐提升数据
- 展示服务端架构设计经验,如高并发、资源调度系统
- 如有模型压缩(量化、剪枝)经验,务必详细描述方法及收益
- 补充TensorRT-LLM或vLLM等LLM推理框架的使用经验
- 熟悉更多DiT推理框架(如xDiT、LightX2V)及加速技术
面试指南
- 对于优化类问题,采用“问题定位→技术选型→实现细节→效果评估”四步法
- 对于系统设计类问题,使用“需求分析→架构设计→关键组件→权衡与优化”框架
- 对于项目经验类问题,采用STAR(情境、任务、行动、结果)方法清晰描述
- 如何优化一个Diffusion模型的推理速度?请从模型、算子、系统层面分别说明
- 设计一个GPU资源管理系统,支持多模型动态调度
- 介绍一个你参与过的模型压缩项目,包括方法、效果和挑战
- 在服务端架构中,如何保证高可用和低延迟?
- CUDA编程中,如何优化内存访问模式以提高性能?
职位点评
71
综合评分
大厂AI架构师,前沿AIGC技术栈,高薪但WLB一般,适合技术驱动型人才。
更适合这类人
最适合追求技术成长和高薪回报的求职者,愿意在快节奏中深耕AI推理优化。
表现最好
成长发展
相对薄弱
工作生活
薪资福利85
成长发展90
工作生活40
使命价值70
薪资福利
85较高
字节跳动作为一线大厂,薪资福利在行业内处于领先地位,但JD未明确具体数字;岗位级别高,薪酬具备竞争力。
薪资信号未披露(AI估算:35K-60K/月)
成长发展
90较高
涉及AIGC前沿技术,GPU优化和模型压缩方向技能稀缺,成长空间大。但JD未明确提及内部培训或晋升机制。
技术前沿前沿/新兴技术
技术栈C++、Golang、CUDA、PyTorch、Diffusion、DiT、TensorRT、模型量化、剪枝、蒸馏
业务类型profit_center
工作生活
40较低
职位要求在多地现场办公,未提及远程或弹性工作,大厂普遍存在一定加班文化,WLB保障不明确。
工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)
使命价值
70中等
AIGC行业高速增长,剪映产品用户规模大,但社会影响力偏中性;岗位创新性强,采用前沿技术。
行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
字节跳动 的其他在招职位
相似职位推荐
Watch Jobs