字节跳动的模型工程技术专家（AI Infra）-剪映Capcut薪资是多少？

该职位薪资范围为 40k–70k（人民币/月）。

模型工程技术专家（AI Infra）-剪映Capcut的工作地点在哪里？

该职位工作地点位于深圳市。工作形式为仅现场办公。

字节跳动的模型工程技术专家（AI Infra）-剪映Capcut有什么任职要求？

该职位要求学历未注明学历及专家级经验工作经验。

字节跳动

模型工程技术专家（AI Infra）-剪映Capcut

立即应聘

模型工程技术专家（AI Infra）-剪映Capcut

发布于大约 2 个月前

普通员工/个人贡献者

深圳市

专家级经验

全职员工

仅现场办公

学历未注明

研究与开发 (研发)

PyTorch

强化学习

GPU优化

CUDA

知识蒸馏

SGLang

vLLM

Moe架构

大模型部署

AI 估算 · 40k–70k

大模型方向热门，技术难度高，市场竞争激烈，字节跳动薪资水准较高。

职位详情

关于这个职位

该职位负责将各类大模型高效部署至生产环境，优化推理性能，并构建强化学习与微调工程链路

适合具有深厚机器学习工程经验、热爱前沿技术挑战的专家

最低要求

扎实的机器技术基础，了解前沿的AI技术，有不错的工程实践经验

具备5年以上机器学习系统工程经验，其中至少2年专注于大模型相关方向

精通Python，熟练掌握PyTorch深度学习框架，并具备优秀的C++/Linux开发和调试能力

拥有从零构建或深度改造大规模模型训练/推理管线的成功经验

具备丰富的GPU集群性能调优与问题诊断经验，熟悉CUDA编程、算子优化及主流推理加速框架（如vLLM，SGlang），能够独立解决内存、通信与计算瓶颈

工作职责

负责将各类大模型（包括MoE架构、多模态模型及未来超大规模模型）高效部署至生产环境，持续跟踪并集成如vLLM、SGLang、xLLM等先进推理框架，保障新模型能够快速、高性能上线

深入数据工程与模型蒸馏领域，通过数据合成、特征工程及知识蒸馏（如软标签蒸馏、特征蒸馏）等技术方案，系统性提升数据利用效率、降低模型部署成本，并验证其在业务中的可行路径

探索并应用创作者Agent等前沿方向，将其能力赋能于训练样本自动合成、Train-Free冷启动及自动化评测等场景，革新传统数据与评估工作流

对业务模型进行深度的推理性能优化，包括但不限于动态批处理、量化压缩、注意力机制优化等，持续降低服务延迟与资源消耗，并积累超大规模（如万亿参数）模型的部署经验与技术储备

负责构建和优化大规模模型的强化学习（RL）、监督微调（SFT）及端到端训练的完整工程链路

提升训练流程的稳定性与吞吐量，并设计和复用离线验证与评测链路，为算法团队提供高效的迭代与效果评估环境

优先资格

）具备强烈的技术好奇心和自我驱动力，能主动跟踪领域前沿，并将论文、开源项目中的创新点转化为可行的工程方案

）深刻理解分布式训练（如DeepSpeed、Megatron-LM）、模型并行、流水线并行及各种微调技术（全参数、LoRA、QLoRA）的原理与实践

AI 洞察

优缺点分析

优点

前沿技术栈，接触最新大模型部署与优化技术
字节跳动平台，资源丰富，项目影响力大
高薪酬与福利，职业发展空间广阔
技术复杂度高，需要持续学习与攻坚
工作强度较大，可能面临加班
竞争激烈，需要不断产出成果

缺点 / 挑战

适合有深厚工程背景、热爱技术挑战、追求快速成长的资深工程师

角色解读

成长为AI Infra领域的资深专家，主导技术方向
有机会转向管理岗位，带领工程团队
可向算法研究或系统架构方向拓展
负责将各类大模型高效部署至生产环境，集成并优化推理框架
深入数据工程与模型蒸馏，提升数据利用效率、降低部署成本
探索创作者Agent等前沿方向，革新数据与评估工作流
构建和优化大规模模型的强化学习、微调等训练工程链路
精通Python、PyTorch，具备优秀的C++/Linux开发能力
丰富的GPU集群性能调优经验，熟悉CUDA编程与推理加速框架
扎实的机器学习基础，了解分布式训练与模型并行技术
对前沿大模型技术保持关注，具备工程落地能力

申请策略

在简历中量化项目成果（延迟降低、吞吐提升等），展现技术深度
准备一个关于大模型部署中解决性能瓶颈的案例，展示问题分析与解决能力
突出大模型部署、推理优化、训练链路构建的具体项目经验
展示GPU性能调优、分布式训练的成功案例
列出对vLLM、DeepSpeed等框架的贡献或深度使用经历
熟悉主流推理框架源码，如vLLM、SGLang
学习CUDA编程与算子优化，提升底层调优能力
了解MoE、多模态等最新模型架构

面试指南

采用STAR法则：情境、任务、行动、结果，强调技术难点与创新点
分析问题原因（内存、计算、通信），提出针对性优化方案，并量化效果
结合具体框架或算法，展示对底层原理的理解
如何优化大模型推理时的显存占用和延迟？
请描述一次你从零搭建分布式训练管线的经历及遇到的挑战
vLLM等推理框架的核心原理是什么？如何选择和使用？
在GPU集群中，如何诊断并解决通信瓶颈？
你对知识蒸馏在模型部署中的应用有何理解？

职位点评

综合评分

高薪前沿技术岗，技术成长极快，但工作强度大，WLB一般。

更适合这类人

重视技术成长与高薪酬，对工作生活平衡要求不高的求职者。

表现最好

成长发展

相对薄弱

工作生活

薪资福利85

成长发展90

工作生活50

使命价值70

薪资福利

85较高

字节跳动薪资水平领先，且大模型方向稀缺度高，补偿性回报丰厚。

薪资信号未披露（AI估算：40K-70K/月）

成长发展

90较高

岗位贴近AI前沿技术栈，涉及推理、训练、优化等多个高成长领域，发展空间极大。

技术前沿前沿/新兴技术

技术栈vLLM、SGLang、PyTorch、CUDA、DeepSpeed、Megatron-LM、MoE

业务类型ambiguous

工作生活

50较低

工作地点在科技园，未提及弹性办公，互联网大厂通常加班较多，WLB一般。

工作模式仅现场办公

办公地点科技园/产业园

加班情况未提及（无法判断）

使命价值

70中等

剪映Capcut服务于视频创作生态，具有一定社会价值，但岗位本身偏技术支撑。

行业发展高速增长赛道

社会影响中性/一般

创新程度积极采用新技术

Watch Jobs

字节跳动

模型工程技术专家（AI Infra）-剪映Capcut

立即应聘

模型工程技术专家（AI Infra）-剪映Capcut

发布于大约 2 个月前

普通员工/个人贡献者

深圳市

专家级经验

全职员工

仅现场办公

学历未注明

研究与开发 (研发)

PyTorch

强化学习

GPU优化

CUDA

知识蒸馏

SGLang

vLLM

Moe架构

大模型部署

AI 估算 · 40k–70k

大模型方向热门，技术难度高，市场竞争激烈，字节跳动薪资水准较高。

职位详情

关于这个职位

该职位负责将各类大模型高效部署至生产环境，优化推理性能，并构建强化学习与微调工程链路

适合具有深厚机器学习工程经验、热爱前沿技术挑战的专家

最低要求

扎实的机器技术基础，了解前沿的AI技术，有不错的工程实践经验

具备5年以上机器学习系统工程经验，其中至少2年专注于大模型相关方向

精通Python，熟练掌握PyTorch深度学习框架，并具备优秀的C++/Linux开发和调试能力

拥有从零构建或深度改造大规模模型训练/推理管线的成功经验

具备丰富的GPU集群性能调优与问题诊断经验，熟悉CUDA编程、算子优化及主流推理加速框架（如vLLM，SGlang），能够独立解决内存、通信与计算瓶颈

工作职责

探索并应用创作者Agent等前沿方向，将其能力赋能于训练样本自动合成、Train-Free冷启动及自动化评测等场景，革新传统数据与评估工作流

负责构建和优化大规模模型的强化学习（RL）、监督微调（SFT）及端到端训练的完整工程链路

提升训练流程的稳定性与吞吐量，并设计和复用离线验证与评测链路，为算法团队提供高效的迭代与效果评估环境

优先资格

）具备强烈的技术好奇心和自我驱动力，能主动跟踪领域前沿，并将论文、开源项目中的创新点转化为可行的工程方案

）深刻理解分布式训练（如DeepSpeed、Megatron-LM）、模型并行、流水线并行及各种微调技术（全参数、LoRA、QLoRA）的原理与实践

AI 洞察

优缺点分析

优点

前沿技术栈，接触最新大模型部署与优化技术
字节跳动平台，资源丰富，项目影响力大
高薪酬与福利，职业发展空间广阔
技术复杂度高，需要持续学习与攻坚
工作强度较大，可能面临加班
竞争激烈，需要不断产出成果

缺点 / 挑战

适合有深厚工程背景、热爱技术挑战、追求快速成长的资深工程师

角色解读

成长为AI Infra领域的资深专家，主导技术方向
有机会转向管理岗位，带领工程团队
可向算法研究或系统架构方向拓展
负责将各类大模型高效部署至生产环境，集成并优化推理框架
深入数据工程与模型蒸馏，提升数据利用效率、降低部署成本
探索创作者Agent等前沿方向，革新数据与评估工作流
构建和优化大规模模型的强化学习、微调等训练工程链路
精通Python、PyTorch，具备优秀的C++/Linux开发能力
丰富的GPU集群性能调优经验，熟悉CUDA编程与推理加速框架
扎实的机器学习基础，了解分布式训练与模型并行技术
对前沿大模型技术保持关注，具备工程落地能力

申请策略

在简历中量化项目成果（延迟降低、吞吐提升等），展现技术深度
准备一个关于大模型部署中解决性能瓶颈的案例，展示问题分析与解决能力
突出大模型部署、推理优化、训练链路构建的具体项目经验
展示GPU性能调优、分布式训练的成功案例
列出对vLLM、DeepSpeed等框架的贡献或深度使用经历
熟悉主流推理框架源码，如vLLM、SGLang
学习CUDA编程与算子优化，提升底层调优能力
了解MoE、多模态等最新模型架构

面试指南

采用STAR法则：情境、任务、行动、结果，强调技术难点与创新点
分析问题原因（内存、计算、通信），提出针对性优化方案，并量化效果
结合具体框架或算法，展示对底层原理的理解
如何优化大模型推理时的显存占用和延迟？
请描述一次你从零搭建分布式训练管线的经历及遇到的挑战
vLLM等推理框架的核心原理是什么？如何选择和使用？
在GPU集群中，如何诊断并解决通信瓶颈？
你对知识蒸馏在模型部署中的应用有何理解？

职位点评

综合评分

高薪前沿技术岗，技术成长极快，但工作强度大，WLB一般。

更适合这类人

重视技术成长与高薪酬，对工作生活平衡要求不高的求职者。

表现最好

成长发展

相对薄弱

工作生活

薪资福利85

成长发展90

工作生活50

使命价值70

薪资福利

85较高

字节跳动薪资水平领先，且大模型方向稀缺度高，补偿性回报丰厚。

薪资信号未披露（AI估算：40K-70K/月）

成长发展

90较高

岗位贴近AI前沿技术栈，涉及推理、训练、优化等多个高成长领域，发展空间极大。

技术前沿前沿/新兴技术

技术栈vLLM、SGLang、PyTorch、CUDA、DeepSpeed、Megatron-LM、MoE

业务类型ambiguous

工作生活

50较低

工作地点在科技园，未提及弹性办公，互联网大厂通常加班较多，WLB一般。

工作模式仅现场办公

办公地点科技园/产业园

加班情况未提及（无法判断）

使命价值

70中等

剪映Capcut服务于视频创作生态，具有一定社会价值，但岗位本身偏技术支撑。

行业发展高速增长赛道

社会影响中性/一般

创新程度积极采用新技术

Watch Jobs

模型工程技术专家（AI Infra）-剪映Capcut

职位详情

关于这个职位

最低要求

工作职责

优先资格

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

模型工程技术专家（AI Infra）-剪映Capcut

职位详情

关于这个职位

最低要求

工作职责

优先资格

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

字节跳动 的其他在招职位

短剧安全应急处置负责人-CQC

服饰KA商业化（男装）-抖音电商

成长型客户销售经理（AI&企业服务）-火山引擎

策略运营（主播运营方向）-TikTok直播

高级前端开发工程师（直播活动研发方向）-TikTok直播

相似职位推荐

Senior Principal Scientist I, Translational Disease Biology

腾讯游戏-大模型评测专家

预研动作手游-资深文案策划（角色方向）

腾讯游戏-大模型智能评测算法工程师

腾讯游戏-大模型训练框架研发工程师/专家

字节跳动 的其他在招职位

短剧安全应急处置负责人-CQC

服饰KA商业化（男装）-抖音电商

成长型客户销售经理（AI&企业服务）-火山引擎

策略运营（主播运营方向）-TikTok直播

高级前端开发工程师（直播活动研发方向）-TikTok直播

相似职位推荐

Senior Principal Scientist I, Translational Disease Biology

腾讯游戏-大模型评测专家

预研动作手游-资深文案策划（角色方向）

腾讯游戏-大模型智能评测算法工程师

腾讯游戏-大模型训练框架研发工程师/专家

字节跳动的其他在招职位

字节跳动的其他在招职位