Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

ByteDance logo
字节跳动
大模型算法工程师(图片美化和创作方向)-剪映CapCut
立即应聘

大模型算法工程师(图片美化和创作方向)-剪映CapCut

发布于 1 天前

普通员工/个人贡献者

深圳市
高级经验
全职员工
仅现场办公
学历未注明
软件工程
PyTorch
多模态
SFT
图像生成
大模型
diffusion
RLHF
ViT

AI 估算 · 35k–75k

大模型算法岗紧缺,字节跳动薪资竞争力强,深圳一线城市,含年终奖预估范围。

职位详情

关于这个职位

该职位负责图片美化和创作Agent的算法研发,包括数据挖掘、模型训练及全链路优化,需将技术落地至剪映CapCut产品

你将深入多模态大模型与图像生成领域,解决高质量图片创作的实际问题,是技术驱动型岗位

最低要求

优秀的代码能力、数据结构和基础算法功底,熟练掌握至少一门语言,ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛获奖者优先

熟悉多模态、CV、ML、NLP等相关的技术,深入理解大模型或图片视频生成等相关技术栈(如RLHF、SFT、Dit/ViT/Transformer等)
在大模型领域,主导过大影响力的项目或论文者优先
在ACL/EMNLP/ECCV/CVPR等顶会发表论文者优先
有图片/视频生成大模型、理解/生成/编辑统一大模型开发训练经验优先
出色的问题分析和解决能力,有自主探索解决方案的能力
优秀的沟通协作能力,能和团队一起探索新技术,推动技术进步
优秀的心理素质与应变能力

工作职责

负责图片美化和创作Agent相关的算法和应用,研究高质量图片创作数据的挖掘和合成、图片创作策略和评估算法、Agent全链路优化方法等

开展高质量数据挖掘清洗对齐、多模态数据自动合成方法、Self-Instruct等方向探索
研究全模态大模型(文本、图像)的Post-training算法,探索图像多模态感知-决策-评估能力
结合业务将技术落地至CapCut图片产品,触达线上海量图片创作者

AI 洞察

优缺点分析

优点

  • 参与前沿大模型在图片美学领域的落地,技术影响力大
  • 字节跳动平台资源丰富,数据量大,成长空间广阔
  • 团队技术氛围浓厚,有机会与顶尖人才合作
  • 薪资待遇优厚,含股票期权,回报可观
  • 业务需求变化快,需要快速迭代和试错,对心理素质要求高
  • 竞争激烈,需要不断产出高水平成果才能脱颖而出
  • 适合技术热情高、动手能力强、渴望在大模型前沿领域做出成果的算法工程师

缺点 / 挑战

  • 技术难度高,需要持续学习最新论文和算法,工作压力可能较大

角色解读

  • 在字节跳动大模型团队中成长为算法专家,或技术Leader,主导核心项目
  • 深入多模态生成领域,向更通用的AI Agent方向发展,成为行业权威
  • 凭借产研结合经验,可转型为AI产品负责人或创业技术合伙人
  • 设计和优化图片美化和创作Agent的算法,包括数据挖掘、合成和评估
  • 探索多模态数据自动合成、Self-Instruct等方法,提升模型效果
  • 研究全模态大模型的Post-training算法,增强感知-决策-评估能力
  • 将算法落地到CapCut图片产品,服务大量图片创作者
  • 扎实的编码和算法功底,精通Python,有竞赛或顶会论文经验优先
  • 深入理解多模态、CV、NLP及大模型技术栈,如RLHF、SFT、ViT、Transformer等
  • 有图片/视频生成大模型开发经验,熟悉Diffusion等生成模型
  • 出色的问题分析和自主探索能力,良好的沟通协作能力

申请策略

  • 了解剪映CapCut的产品形态和用户场景,在面试中展示对美颜、特效等业务的理解
  • 强调自驱力和探索精神,字节喜欢主动解决问题的候选人
  • 突出大模型相关项目经历,尤其是图片/视频生成、多模态方向,附上GitHub或论文链接
  • 强调竞赛获奖(如Kaggle)和顶会论文(如CVPR、ACL)的成果
  • 详细描述在数据挖掘、模型训练、RLHF等方向的具体贡献和量化结果
  • 展示代码能力,如LeetCode高分或开源项目贡献
  • 补充多模态大模型的Post-training技术,如DPO、GRPO等最新方法
  • 学习Diffusion模型(如Stable Diffusion)及其在图片编辑中的应用

面试指南

  • STAR法则:情景、任务、行动、结果,清晰描述项目背景和个人贡献
  • 技术对比法:分析不同方法的优劣,结合业务场景提出自己的见解
  • 问题拆解法:将复杂问题分解为子问题,逐步推理并给出可行方案
  • 请介绍一个你参与过的多模态或大模型项目,技术难点和解决方案是什么?
  • 如何评价当前图片生成模型的优缺点?你认为提升生成质量的瓶颈在哪里?
  • 解释RLHF在语言模型中的应用,如何将其迁移到图像生成领域?
  • 给定一个图片美化的业务需求,你会如何设计数据收集和模型训练方案?
  • 你熟悉的Transformer变体有哪些?ViT在图像任务中的局限性是什么?

职位点评

70
综合评分

前沿大模型算法岗,技术成长极佳,薪资优厚,但工作强度可能较大。

更适合这类人
最适合追求技术成长和行业前沿的求职者,愿意接受挑战,对工作生活平衡要求不高。
表现最好
成长发展
相对薄弱
工作生活
薪资福利85
成长发展95
工作生活40
使命价值60

薪资福利

85较高

字节跳动为已上市巨头,薪资水平在行业内具有较强竞争力,加上可能的股票期权,补偿性动机满足度高。

薪资信号未披露(AI估算:35K-75K/月)

成长发展

95较高

岗位涉及大模型前沿技术,有大量独立探索空间,且字节跳动技术氛围浓厚,发展性动机充分满足。

技术前沿前沿/新兴技术
技术栈大模型、多模态、RLHF、SFT、Diffusion、ViT、Transformer、Self-Instruct
成长机会自主探索解决方案、探索新技术
业务类型profit_center

工作生活

40较低

字节跳动通常工作节奏较快,且未提及远程或弹性办公,生活化动机可能受限。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值

60中等

该岗位服务于C端产品,改善用户图片创作体验,具有一定社会价值,但主要驱动是商业变现,意义感中等。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 客户端安全工程师

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 区域配送商务Leader-TikTok Shop

    字节跳动 · 上海市
    AI 估算 · 50k-80k
  • 零售行业高级解决方案经理-火山引擎

    字节跳动 · 北京市
    AI 估算 · 30k-50k
  • C端内容产品设计师-生活服务(上海)

    字节跳动 · 上海市
    AI 估算 · 20k-40k
  • 云原生产品专家-微服务

    字节跳动 · 上海市
    AI 估算 · 35k-60k

相似职位推荐

  • 平台开发工程师

    中国移动 · 北京市
    AI 估算 · 20k-35k

字节跳动 的其他在招职位

  • 客户端安全工程师

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 区域配送商务Leader-TikTok Shop

    字节跳动 · 上海市
    AI 估算 · 50k-80k
  • 零售行业高级解决方案经理-火山引擎

    字节跳动 · 北京市
    AI 估算 · 30k-50k
  • C端内容产品设计师-生活服务(上海)

    字节跳动 · 上海市
    AI 估算 · 20k-40k
  • 云原生产品专家-微服务

    字节跳动 · 上海市
    AI 估算 · 35k-60k

相似职位推荐

  • 平台开发工程师

    中国移动 · 北京市
    AI 估算 · 20k-35k