ByteDance logo
字节跳动
大模型算法工程师(数据方向)-剪映CapCut(北京/深圳/广州)

大模型算法工程师(数据方向)-剪映CapCut(北京/深圳/广州)

发布于 大约 1 小时前

普通员工/个人贡献者

北京市 / 深圳市
中级经验
全职员工
仅现场办公
学历未注明
NLP
数据挖掘
多模态
SFT
Machine Learning
数据合成
大模型
CV
RL
diffusion

AI 估算 · 35k–60k

大模型算法工程师市场需求旺盛,字节跳动薪资竞争力强,结合技术难度与稀缺性,预估月薪范围合理。

职位详情

关于这个职位

该职位负责视频/图片创作Agent的核心研发,聚焦高质量数据建设与多模态大模型优化,实现模型在理解、生成、编辑等能力的提升,并推动技术落地服务创作者

适合对数据驱动和生成技术有热情的算法工程师

最低要求

扎实的编程能力,良好的代码工程习惯,熟练掌握至少一种主流编程语言(如Python、C++)

熟悉NLP、CV、ML、RL等相关技术,理解大模型及生成技术栈(如Transformer、Diffusion、SFT、RLHF等)
具备优秀的问题建模与分析能力,对数据驱动方法有热情,关注技术落地效果,主动性强
对视频/图片创作方向感兴趣,有文案生成、创意生成等实际项目经验者优先
良好的沟通协作能力,与团队探索新技术,具备出色的心理素质与应变能力,敢于迎接挑战

工作职责

负责视频/图片创作Agent的核心研发与应用,聚焦高质量数据建设,包括数据挖掘清洗对齐、多领域的数据自动合成、创意库构建等,优化Agent全链路的生成效果

多模态大模型的训练与优化,实现模型在理解、生成、编辑和控制等关键能力上的全面提升
建立并迭代多模态数据的质量评估体系、模态对齐机制与覆盖策略,探索数据与模型的共进化反馈体系
结合实际业务场景,将创新性技术方案高效落地,服务成千上万创作者,推动内容创作AI能力的持续突破

优先资格

对视频/图片创作方向感兴趣,有文案生成、创意生成等实际项目经验者优先

AI 洞察

优缺点分析

优点

  • 字节跳动平台资源丰富,项目影响力大,可接触海量用户数据
  • 技术栈前沿,聚焦大模型和多模态,紧跟AI发展趋势
  • 团队氛围技术导向,成长空间大,能快速积累核心算法经验
  • 工作强度较大,可能需要应对快速迭代和高标准要求
  • 技术难度高,需要持续学习最新模型和算法,保持竞争力
  • 适合对AI生成技术有热情、具备扎实算法基础和较强学习能力的求职者

缺点 / 挑战

  • 业务落地压力大,需平衡研究创新与工程效率

角色解读

  • 可向大模型技术专家方向深耕,成为算法负责人或技术Leader
  • 可横向拓展到多模态、视频理解、AIGC等前沿领域,参与核心产品研发
  • 随着AI创作领域快速发展,有机会晋升为团队骨干或技术架构师
  • 负责高质量数据建设,包括数据挖掘、清洗、对齐和自动合成,以优化Agent生成效果
  • 训练和优化多模态大模型,提升模型在理解、生成、编辑和控制方面的能力
  • 建立数据质量评估体系和模态对齐机制,探索数据与模型的共进化反馈
  • 将创新技术方案落地到实际业务场景,服务创作用户,推动AI内容创作突破
  • 扎实的编程能力,熟练掌握Python或C++,有良好的工程习惯
  • 熟悉NLP、CV、ML、RL等技术,理解Transformer、Diffusion、SFT、RLHF等大模型技术栈
  • 优秀的问题建模与数据分析能力,对数据驱动方法有热情
  • 良好的沟通协作能力,能团队探索新技术,具备心理素质与应变能力

申请策略

  • 了解字节跳动剪映CapCut的产品方向,思考如何将算法能力与创作场景结合
  • 准备一个高质量的项目案例,展示从问题定义到落地的完整过程
  • 突出大模型相关项目经验,尤其是数据建设、模型训练或优化方向
  • 强调编程能力和工程实现细节,如使用Python/C++开发的模块
  • 展示NLP、CV、多模态等领域的成果,如论文、开源贡献或竞赛成绩
  • 提及创作类项目经历(如文案生成、视频编辑)加分
  • 深入理解Transformer、Diffusion等架构原理,动手复现经典模型
  • 积累数据清洗、合成、对齐的实战经验,了解常见数据策略

面试指南

  • 用STAR法则描述项目:情境、任务、行动、结果,突出你的贡献和数据策略
  • 技术问题从原理到应用逐步展开,结合具体例子说明你的理解深度
  • 场景问题先分析用户需求,再提出技术方案,最后预估效果和迭代方向
  • 请介绍一个你参与的大模型项目,包括数据建设、模型选择和效果评估
  • 如何设计一个数据合成方案来提升多模态模型的生成质量?
  • 谈谈你对Transformer和Diffusion模型的理解及各自的优缺点
  • 在数据驱动优化中,如何平衡数据质量与数量?
  • 你对视频/图片创作场景有哪些技术想法?

匹配度报告

71
综合匹配度

大厂前沿大模型岗位,技术成长快、薪资高,但工作强度大、WLB一般。

适合人群
最适合追求技术成长和前沿挑战的求职者,愿意投入高强度工作换取高回报。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展90
工作生活40
使命价值70

薪资福利匹配

85较高

字节跳动薪资在行业内具有较强竞争力,但JD未明确具体福利,稳定性受限于高强度工作文化。

薪资信号偏高 (35K-60K/月)

成长发展匹配

90较高

岗位聚焦大模型和多模态前沿技术,成长空间巨大,但JD未明确提及晋升通道或培训。

技术前沿前沿/新兴技术
技术栈大模型、多模态、Transformer、Diffusion、SFT、RLHF
业务类型profit_center

工作生活匹配

40较低

工作地点在一线城市,但需要现场办公,且互联网行业普遍工作强度高,JD未提及任何WLB措施。

工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值匹配

70中等

AI创作领域处于高速增长赛道,能提升创作者效率,具有正向社会影响力,但JD未明确使命感。

行业发展高速增长赛道
社会影响正向社会影响力较高
创新程度积极采用新技术
Watch Jobs