Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
模型工程技术专家(AI Infra)-剪映Capcut
立即应聘

模型工程技术专家(AI Infra)-剪映Capcut

发布于 大约 9 小时前

普通员工/个人贡献者

深圳市
专家级经验
全职员工
仅现场办公
学历未注明
PyTorch
强化学习
GPU优化
CUDA
知识蒸馏
SGLang
vLLM
Moe架构
大模型部署

AI 估算 · 40k–70k

大模型方向热门,技术难度高,市场竞争激烈,字节跳动薪资水准较高。

职位详情

关于这个职位

该职位负责将各类大模型高效部署至生产环境,优化推理性能,并构建强化学习与微调工程链路

适合具有深厚机器学习工程经验、热爱前沿技术挑战的专家

最低要求

扎实的机器技术基础,了解前沿的AI技术,有不错的工程实践经验

具备5年以上机器学习系统工程经验,其中至少2年专注于大模型相关方向
精通Python,熟练掌握PyTorch深度学习框架,并具备优秀的C++/Linux开发和调试能力
拥有从零构建或深度改造大规模模型训练/推理管线的成功经验
具备丰富的GPU集群性能调优与问题诊断经验,熟悉CUDA编程、算子优化及主流推理加速框架(如vLLM,SGlang),能够独立解决内存、通信与计算瓶颈

工作职责

负责将各类大模型(包括MoE架构、多模态模型及未来超大规模模型)高效部署至生产环境,持续跟踪并集成如vLLM、SGLang、xLLM等先进推理框架,保障新模型能够快速、高性能上线

深入数据工程与模型蒸馏领域,通过数据合成、特征工程及知识蒸馏(如软标签蒸馏、特征蒸馏)等技术方案,系统性提升数据利用效率、降低模型部署成本,并验证其在业务中的可行路径
探索并应用创作者Agent等前沿方向,将其能力赋能于训练样本自动合成、Train-Free冷启动及自动化评测等场景,革新传统数据与评估工作流
对业务模型进行深度的推理性能优化,包括但不限于动态批处理、量化压缩、注意力机制优化等,持续降低服务延迟与资源消耗,并积累超大规模(如万亿参数)模型的部署经验与技术储备
负责构建和优化大规模模型的强化学习(RL)、监督微调(SFT)及端到端训练的完整工程链路
提升训练流程的稳定性与吞吐量,并设计和复用离线验证与评测链路,为算法团队提供高效的迭代与效果评估环境

优先资格

)具备强烈的技术好奇心和自我驱动力,能主动跟踪领域前沿,并将论文、开源项目中的创新点转化为可行的工程方案

)深刻理解分布式训练(如DeepSpeed、Megatron-LM)、模型并行、流水线并行及各种微调技术(全参数、LoRA、QLoRA)的原理与实践

AI 洞察

优缺点分析

优点

  • 前沿技术栈,接触最新大模型部署与优化技术
  • 字节跳动平台,资源丰富,项目影响力大
  • 高薪酬与福利,职业发展空间广阔
  • 技术复杂度高,需要持续学习与攻坚
  • 工作强度较大,可能面临加班
  • 竞争激烈,需要不断产出成果

缺点 / 挑战

  • 适合有深厚工程背景、热爱技术挑战、追求快速成长的资深工程师

角色解读

  • 成长为AI Infra领域的资深专家,主导技术方向
  • 有机会转向管理岗位,带领工程团队
  • 可向算法研究或系统架构方向拓展
  • 负责将各类大模型高效部署至生产环境,集成并优化推理框架
  • 深入数据工程与模型蒸馏,提升数据利用效率、降低部署成本
  • 探索创作者Agent等前沿方向,革新数据与评估工作流
  • 构建和优化大规模模型的强化学习、微调等训练工程链路
  • 精通Python、PyTorch,具备优秀的C++/Linux开发能力
  • 丰富的GPU集群性能调优经验,熟悉CUDA编程与推理加速框架
  • 扎实的机器学习基础,了解分布式训练与模型并行技术
  • 对前沿大模型技术保持关注,具备工程落地能力

申请策略

  • 在简历中量化项目成果(延迟降低、吞吐提升等),展现技术深度
  • 准备一个关于大模型部署中解决性能瓶颈的案例,展示问题分析与解决能力
  • 突出大模型部署、推理优化、训练链路构建的具体项目经验
  • 展示GPU性能调优、分布式训练的成功案例
  • 列出对vLLM、DeepSpeed等框架的贡献或深度使用经历
  • 熟悉主流推理框架源码,如vLLM、SGLang
  • 学习CUDA编程与算子优化,提升底层调优能力
  • 了解MoE、多模态等最新模型架构

面试指南

  • 采用STAR法则:情境、任务、行动、结果,强调技术难点与创新点
  • 分析问题原因(内存、计算、通信),提出针对性优化方案,并量化效果
  • 结合具体框架或算法,展示对底层原理的理解
  • 如何优化大模型推理时的显存占用和延迟?
  • 请描述一次你从零搭建分布式训练管线的经历及遇到的挑战
  • vLLM等推理框架的核心原理是什么?如何选择和使用?
  • 在GPU集群中,如何诊断并解决通信瓶颈?
  • 你对知识蒸馏在模型部署中的应用有何理解?

匹配度报告

74
综合匹配度

高薪前沿技术岗,技术成长极快,但工作强度大,WLB一般。

适合人群
重视技术成长与高薪酬,对工作生活平衡要求不高的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展90
工作生活50
使命价值70

薪资福利匹配

85较高

字节跳动薪资水平领先,且大模型方向稀缺度高,补偿性回报丰厚。

薪资信号未披露(AI估算:40K-70K/月)

成长发展匹配

90较高

岗位贴近AI前沿技术栈,涉及推理、训练、优化等多个高成长领域,发展空间极大。

技术前沿前沿/新兴技术
技术栈vLLM、SGLang、PyTorch、CUDA、DeepSpeed、Megatron-LM、MoE
业务类型ambiguous

工作生活匹配

50较低

工作地点在科技园,未提及弹性办公,互联网大厂通常加班较多,WLB一般。

工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值匹配

70中等

剪映Capcut服务于视频创作生态,具有一定社会价值,但岗位本身偏技术支撑。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 服务器整机结构工程师-Data

    字节跳动 · 杭州市
    AI 估算 · 25k-45k
  • 内容营销经理(飞书AI/Agent方向)-飞书

    字节跳动 · 上海市
    AI 估算 · 20k-35k
  • 游戏动作设计组长/专家

    字节跳动 · 深圳市
    AI 估算 · 25k-40k
  • 后端研发工程师-客服平台(成都)

    字节跳动 · 成都市
    AI 估算 · 20k-35k
  • 内容分发策略产品-红果短剧

    字节跳动 · 北京市
    AI 估算 · 20k-35k

相似职位推荐

  • PSIG_智能体算法工程师(J99389)

    百度 · 北京市
    AI 估算 · 25k-45k
  • Agent算法研究实习生(演化策略方向)(J100042)

    百度 · 北京市
    AI 估算 · 4k-8k

字节跳动 的其他在招职位

  • 服务器整机结构工程师-Data

    字节跳动 · 杭州市
    AI 估算 · 25k-45k
  • 内容营销经理(飞书AI/Agent方向)-飞书

    字节跳动 · 上海市
    AI 估算 · 20k-35k
  • 游戏动作设计组长/专家

    字节跳动 · 深圳市
    AI 估算 · 25k-40k
  • 后端研发工程师-客服平台(成都)

    字节跳动 · 成都市
    AI 估算 · 20k-35k
  • 内容分发策略产品-红果短剧

    字节跳动 · 北京市
    AI 估算 · 20k-35k

相似职位推荐

  • PSIG_智能体算法工程师(J99389)

    百度 · 北京市
    AI 估算 · 25k-45k
  • Agent算法研究实习生(演化策略方向)(J100042)

    百度 · 北京市
    AI 估算 · 4k-8k