Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
大模型算法工程师(视频/图片创作-评估方向)-剪映CapCut(北京/上海/杭州/深圳/广州)
立即应聘

大模型算法工程师(视频/图片创作-评估方向)-剪映CapCut(北京/上海/杭州/深圳/广州)

发布于 大约 16 小时前

普通员工/个人贡献者

北京市 / 上海市
高级经验
全职员工
仅现场办公
学历未注明
NLP
SFT
CV
RL
Prompt Engineering
RLHF
DiT
ViT
多模态评估

AI 估算 · 35k–65k

字节跳动核心部门,大模型方向薪资溢价高,多城市一线薪资,结合岗位级别和行业水平估算。

职位详情

关于这个职位

该职位专注于视频/图片创作Agent的自动化评测能力建设,涉及Prompt Engineering、SFT、RL等前沿技术,通过构建多模态评估框架和闭环反馈优化生成效果

你将与业务团队深度协作,推动评估方案规模化落地,并持续提升内容质量和创作者体验
适合对大模型、多模态评估有浓厚兴趣,追求技术创新的算法工程师

最低要求

优秀的代码能力、数据结构和基础算法功底,熟练掌握至少一门语言,ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛获奖者优先

熟悉NLP、CV、ML等相关的技术,深入理解大模型或图片视频生成等相关技术栈(如RLHF、SFT、Dit/Vit/Transformer等)
出色的问题分析和解决能力,有自主探索解决方案的能力
良好的沟通协作能力,能和团队一起探索新技术,推动技术进步
优秀的心理素质与应变能力,面对困难勇于迎接挑战

工作职责

负责视频/图片创作Agent的核心研发与应用,聚焦自动化评测能力建设,应用Prompt Engineering、SFT、RL等方法,持续优化评估模型的准确性、效率及泛化能力,并通过评估反馈闭环驱动创作Agent生成效果优化

跟进业界学术界技术进展,构建与优化覆盖文本、图像、语音等多模态内容的评估框架与系统
制定高质量数据评估标准及人机对齐拟合评估策略,推动评估系统在精确度、鲁棒性与可扩展性方面达到业界领先水平
深度协同业务团队,主导自动化评估方案在各业务场景的规模化落地应用
主导定制化评测数据集的开发,持续演进评测指标体系,确保自动化评估能力高效支撑各创作环节,提升内容生成质量、业务指标及创作者体验
系统分析行业主流产品与自研模型在多维评估指标下的表现差异,洞察核心瓶颈与优化点,为模型的性能调优与评估体系的升级提供关键决策依据

优先资格

深入理解及运用常用的语言、视觉、视频/图片生成模型评价指标等

在大模型领域,主导过大影响力的项目或论文者优先
在ACL/EMNLP/ECCV/CVPR等顶会发表论文者优先

AI 洞察

优缺点分析

优点

  • 技术前沿:聚焦大模型和多模态生成,接触Prompt Engineering、RLHF等热门方向,技术积累价值高
  • 平台优势:字节跳动拥有海量用户和业务场景,能快速验证和迭代技术方案,影响力大
  • 团队氛围:与高水平的同事合作,有清晰的成长路径和资源支持,可发表顶会论文
  • 技术难度高:需要同时掌握NLP、CV、大模型训练和评估等多个领域知识,学习曲线陡峭
  • 竞争激烈:岗位吸引众多优秀候选人,面试和入职后都需要持续证明自身能力
  • 适合对多模态评估和大模型优化有强烈兴趣,具备扎实算法功底和快速学习能力,愿意在高压环境中追求技术突破的工程师

缺点 / 挑战

  • 工作强度大:互联网大厂核心业务,可能有较强的时间压力和kpi要求,需要持续学习和适应

角色解读

  • 向多模态评估专家或大模型应用专家发展,深入掌握自动化评测与生成技术
  • 横向扩展至创作Agent全链路研发,成为算法团队技术骨干或负责人
  • 积累行业影响力,通过顶会论文和开源项目成为领域知名专家
  • 负责构建和优化视频/图片创作Agent的自动化评测系统,包括设计评估框架、制定数据标准
  • 应用Prompt Engineering、SFT、RL等方法训练和优化评估模型,提升准确性和泛化能力
  • 与业务团队协作,将评估方案落地到不同创作场景,并通过闭环反馈驱动生成效果提升
  • 跟踪前沿技术,分析行业竞品,识别模型瓶颈,推动评估体系升级
  • 扎实的编程能力(Python/C++等)和算法基础,熟悉数据结构与主流竞赛经验更佳
  • 深入理解NLP、CV、ML领域,熟悉大模型训练技术(RLHF、SFT)及Transformer、DiT等架构
  • 掌握多模态评估指标(如FID、CLIP Score、BLEU)和评测方法论,能构建人机对齐的评估策略
  • 良好的问题分析与沟通协作能力,能主导技术方向并推动落地

申请策略

  • 在简历中用量化结果突出你对评估系统的影响,例如‘提升了xx%的准确率’或‘覆盖了xx个场景’
  • 面试前研究剪映CapCut的产品功能,思考其评估需求,准备有针对性的解决方案
  • 突出大模型相关项目经验,尤其是自动化评测、RLHF、SFT等方向的实践
  • 展示顶会论文、竞赛获奖(如Kaggle、ACM)或开源贡献,证明学术和工程实力
  • 强调多模态(文本、图像、视频)领域的项目成果,包括评估指标优化和模型调优经历
  • 系统学习大模型训练技术(如RLHF、SFT),掌握主流框架(PyTorch、HuggingFace)
  • 深入理解常见生成模型评估指标(如FID、Inception Score、CLIP Score),并尝试在实践中应用
  • 补强多模态知识,了解视频/图像生成模型(Diffusion、GAN)的原理和评估方法

面试指南

  • 使用STAR结构:情境-任务-行动-结果,突出技术难点和你的贡献
  • 对于开放设计题,先明确问题边界,列出关键因素,再给出权衡方案,展现系统性思考
  • 对于技术细节题,结合数学原理和工程实践,举例说明调优过程
  • 请介绍一个你主导的自动化评测项目,包括评测指标如何选择、如何保证评估质量?
  • 如何设计一个多模态(文本+图像)评估框架?需要考虑哪些维度?
  • RLHF中的奖励模型如何训练?如何避免reward hacking?
  • 比较几种视频生成模型的评估指标(如FVD、CLIP Score),它们的优缺点是什么?
  • 如果你发现自动评估结果与人工评估不一致,你会如何分析和解决?

匹配度报告

70
综合匹配度

大厂核心算法岗位,前沿技术栈、高薪资、高成长,但工作强度较大且WLB一般。

适合人群
该职位最适合追求技术成长和丰富薪酬回报的求职者,特别是对大模型和多模态评测有热情的工程师。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利80
成长发展90
工作生活40
使命价值70

薪资福利匹配

80较高

字节跳动薪资待遇在行业中处于领先水平,但职位未明确具体薪资和福利,整体补偿性较好。

薪资信号偏高 (35K-65K/月)

成长发展匹配

90较高

职位涉及前沿技术(大模型、多模态评估),成长空间大,有顶会论文和项目主导机会,发展性动机满足度高。

技术前沿前沿/新兴技术
技术栈Prompt Engineering、SFT、RL、RLHF、Transformer、DiT、ViT、多模态评估
成长机会主导过有影响力的项目或论文优先
业务类型profit_center

工作生活匹配

40较低

要求仅现场办公且可能在多个城市,未提及弹性工作或WLB,互联网大厂整体工作节奏较快。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

70中等

职位服务于视频/图片创作场景,推动内容生成质量提升,有一定创新价值,但社会意义偏中性。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 大模型算法工程师-商品治理

    字节跳动 · 北京市
    AI 估算 · 35k-60k
  • 芯片DFT工程师(深圳)

    字节跳动 · 深圳市
    AI 估算 · 25k-45k
  • 大模型代码评测专家-大模型数据服务中心

    字节跳动 · 北京市
    AI 估算 · 25k-50k
  • AI客户端开发工程师(应用研究方向)-集团信息系统

    字节跳动 · 上海市
    AI 估算 · 25k-45k
  • 媒介专家-媒介一组

    字节跳动 · 北京市
    AI 估算 · 25k-40k

相似职位推荐

  • 试验工程师

    中国融通集团 · 北京市
    AI 估算 · 10k-10k
  • ADAS Driving System Verification Senior Engineer_智能驾驶辅助系统测试验证高级工程师

    奔驰 · 北京市
    AI 估算 · 25k-40k
  • AIGC算法工程师(创意Agent/文案生成方向)

    小红书 · 北京市
    AI 估算 · 30k-60k
  • Lab Research & Development Intern

    国际香精香料公司 · 肇庆市
    AI 估算 · 3k-5k
  • Lab Research & Development Intern

    国际香精香料公司 · 肇庆市
    AI 估算 · 3k-5k

字节跳动 的其他在招职位

  • 大模型算法工程师-商品治理

    字节跳动 · 北京市
    AI 估算 · 35k-60k
  • 芯片DFT工程师(深圳)

    字节跳动 · 深圳市
    AI 估算 · 25k-45k
  • 大模型代码评测专家-大模型数据服务中心

    字节跳动 · 北京市
    AI 估算 · 25k-50k
  • AI客户端开发工程师(应用研究方向)-集团信息系统

    字节跳动 · 上海市
    AI 估算 · 25k-45k
  • 媒介专家-媒介一组

    字节跳动 · 北京市
    AI 估算 · 25k-40k

相似职位推荐

  • 试验工程师

    中国融通集团 · 北京市
    AI 估算 · 10k-10k
  • ADAS Driving System Verification Senior Engineer_智能驾驶辅助系统测试验证高级工程师

    奔驰 · 北京市
    AI 估算 · 25k-40k
  • AIGC算法工程师(创意Agent/文案生成方向)

    小红书 · 北京市
    AI 估算 · 30k-60k
  • Lab Research & Development Intern

    国际香精香料公司 · 肇庆市
    AI 估算 · 3k-5k
  • Lab Research & Development Intern

    国际香精香料公司 · 肇庆市
    AI 估算 · 3k-5k