Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
大模型自动评测专家(ToB图片/视频生成方向)-AI数据与安全
立即应聘

大模型自动评测专家(ToB图片/视频生成方向)-AI数据与安全

发布于 1 天前

普通员工/个人贡献者

北京市
中级经验
全职员工
仅现场办公
本科
自动化
视频生成
归因分析
模型优化
Prompt Engineering
图片生成
多模态大模型
评估体系
商业审美
Workflow

AI 估算 · 30k–50k

AI大模型方向紧缺,字节跳动薪资竞争力强,预计月薪3-5万,15薪

职位详情

关于这个职位

该职位负责对多模态大模型生成的视频与图片进行系统性评测,制定贴合To B业务需求的评估体系与出题策略

你将结合商业审美与行业标准,设计评测数据与评分标准,推动评估流程自动化,并协同算法与产品团队优化模型效果
适合对AI生成内容有浓厚兴趣、具备审美和逻辑分析能力的技术人才

最低要求

本科及以上学历,影视、美学、动画、广告、新媒体、设计等相关专业背景优先

具备商业审美并对细节敏感,理解B端视频/图片生成场景的商业需求及质量痛点,有视觉生成操作经验优先
有视觉内容评估经验与模型负面案例归因分析经验,能独立完成构建评测集以及评测题目优先
具备成熟的Prompt Engineering与Workflow构建能力,能够推动评估自动化流程落地
熟悉多模态大模型(如视频生成、图像生成)的技术原理与常见局限,具备质量归因能力或实践经验,并能够体系化输出相关分析结果或方法论
表达逻辑清晰,协作能力强,能够高效协同产品、算法、标注等团队,将评估结果转化为模型优化建议

工作职责

负责对多模态大模型生成的视频与图片进行系统性评测,制定贴合To B业务需求的评估体系与出题策略

结合商业审美与行业标准,设计符合To B场景的评测数据、质量评估维度与评分标准,推动评估流程的自动化与标准化
深入分析生成视频/图片的质量问题,精准归因问题来源,协同算法与产品团队提出优化建议
具备Prompt Engineering与Workflow构造能力,将主观审美与质量判断转化为可量化评估指标
持续跟踪生成模型技术进展,结合实际业务需求更新评测方法与出题策略

AI 洞察

优缺点分析

优点

  • 在字节跳动头部平台接触前沿AI技术(多模态生成),积累宝贵经验
  • 参与制定B端评测标准,提升个人在行业内的专业影响力
  • 薪资福利优厚,职业发展空间大,团队技术氛围浓厚
  • 评测工作需要高度细致和耐心,工作强度可能较大
  • 技术更新迅速,需要持续学习以保持竞争力
  • 跨团队协作要求沟通能力突出,需处理多方需求
  • 适合对AI生成内容有浓厚兴趣、具备审美和逻辑分析能力,且希望在大厂深耕AI评测领域的技术人才

缺点 / 挑战

暂无明显挑战项

角色解读

  • 深耕AI评测领域,成为评测专家或技术Leader,定义行业标准
  • 转向AI产品经理或算法研究方向,利用评测经验推动产品迭代
  • 在字节跳动内部横向发展,进入数据安全、AI应用或商业化等方向
  • 设计并执行多模态大模型(视频/图片生成)的系统性评测方案,包括制定评估维度和评分标准
  • 分析模型生成内容的质量问题,定位缺陷根因,并协同算法与产品团队推动优化
  • 利用Prompt Engineering和Workflow自动化评估流程,提升效率与一致性
  • 跟踪最新生成模型技术进展,持续更新评测方法与策略
  • 熟悉多模态大模型(如视频生成、图像生成)的技术原理与常见局限,具备质量归因能力
  • 具备商业审美和对细节的敏感度,能够将主观审美转化为可量化评估指标
  • 精通Prompt Engineering与Workflow构建,能推动自动化评估落地
  • 逻辑清晰,协作能力强,能高效跨团队沟通

申请策略

  • 在简历中附作品集或评测报告样例,证明实操能力
  • 提前了解字节跳动AI数据与安全部门的业务方向,面试中展示业务匹配度
  • 突出视觉内容评估或模型评测相关项目经验,包括数据集构建、指标设计等
  • 强调Prompt Engineering和自动化工具使用案例,展示技术落地能力
  • 展示对多模态大模型的理解,如论文复现、模型对比分析等
  • 体现商业审美和B端业务理解,如曾参与商业视觉项目
  • 学习更系统的评估方法论,如自动化评测框架和统计分析方法
  • 掌握视频/图像生成技术原理,了解主流模型(如Sora, Stable Video Diffusion)的优缺点

面试指南

  • 明确评测目标,设计多维度指标体系(客观+主观),并规划自动化执行流程
  • 通过用户调研、专家评分和数据分析结合的方式量化主观指标,如使用CMOS评分
  • 按照“问题发现-假设验证-根因定位-解决方案”结构描述案例,体现逻辑链
  • 如何为一个视频生成模型设计一套完整的评测方案?
  • 如何将主观审美(如“画面质感”)量化为可衡量的指标?
  • 描述一个你发现并归因模型缺陷的案例,包括分析过程和最终结论
  • 你如何保证评测结果的可靠性和可重复性?
  • 对当前主流视频生成模型(如Sora、Runway)有什么看法?你认为它们的主要局限是什么?

匹配度报告

74
综合匹配度

字节跳动AI评测专家,前沿技术栈,薪资优厚,但办公地点固定且可能加班。

适合人群
适合追求技术成长和薪资回报,能接受一定工作强度的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利80
成长发展85
工作生活60
使命价值70

薪资福利匹配

80较高

字节跳动提供有竞争力的薪资和福利,但JD未具体披露,评分偏正面。

薪资信号未披露(AI估算:30K-50K/月)

成长发展匹配

85较高

多模态大模型属于前沿技术,职位涉及评估体系设计,有较大成长空间,但JD未明确培训或晋升路径。

技术前沿前沿/新兴技术
技术栈多模态大模型、视频生成、图片生成、Prompt Engineering、Workflow
业务类型profit_center

工作生活匹配

60中等

北京现场办公,未提及灵活工作安排,可能有一定工作强度。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

70中等

AI行业高速增长,但职位本身社会影响力中性,创新性属于积极采用新技术。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • AI平台研发工程师-集团信息系统

    字节跳动 · 深圳市
    AI 估算 · 25k-45k
  • 国际业务内容商务拓展专家-Dola

    字节跳动 · 北京市
    AI 估算 · 35k-65k
  • 商业化营销策略专家-抖音生活服务

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • HRBP-中国公共职能(北京)

    字节跳动 · 北京市
    AI 估算 · 20k-30k
  • 产品经理(导航/路线/路况)-地理位置中台

    字节跳动 · 北京市
    AI 估算 · 25k-40k

相似职位推荐

  • 开发工程师

    中国移动 · 贵阳市
    AI 估算 · 12k-20k
  • Dots-【Ace顶尖实习生】Long Horizon Agentic Task 能力提升研究

    小红书 · 北京市
    AI 估算 · 4k-8k

字节跳动 的其他在招职位

  • AI平台研发工程师-集团信息系统

    字节跳动 · 深圳市
    AI 估算 · 25k-45k
  • 国际业务内容商务拓展专家-Dola

    字节跳动 · 北京市
    AI 估算 · 35k-65k
  • 商业化营销策略专家-抖音生活服务

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • HRBP-中国公共职能(北京)

    字节跳动 · 北京市
    AI 估算 · 20k-30k
  • 产品经理(导航/路线/路况)-地理位置中台

    字节跳动 · 北京市
    AI 估算 · 25k-40k

相似职位推荐

  • 开发工程师

    中国移动 · 贵阳市
    AI 估算 · 12k-20k
  • Dots-【Ace顶尖实习生】Long Horizon Agentic Task 能力提升研究

    小红书 · 北京市
    AI 估算 · 4k-8k