字节跳动的大模型自动评测专家（ToB图片/视频生成方向）-AI数据与安全薪资是多少？

该职位薪资范围为 30k–50k（人民币/月）。

大模型自动评测专家（ToB图片/视频生成方向）-AI数据与安全的工作地点在哪里？

该职位工作地点位于北京市。工作形式为仅现场办公。

字节跳动的大模型自动评测专家（ToB图片/视频生成方向）-AI数据与安全有什么任职要求？

该职位要求本科学历及中级经验工作经验。

字节跳动

大模型自动评测专家（ToB图片/视频生成方向）-AI数据与安全

立即应聘

大模型自动评测专家（ToB图片/视频生成方向）-AI数据与安全

发布于大约 2 个月前

普通员工/个人贡献者

北京市

中级经验

全职员工

仅现场办公

本科

研究与开发 (研发)

Prompt Engineering

Workflow

商业审美

图片生成

多模态大模型

归因分析

模型优化

自动化

视频生成

AI 估算 · 30k–50k

AI大模型方向紧缺，字节跳动薪资竞争力强，预计月薪3-5万，15薪

职位详情

关于这个职位

该职位负责对多模态大模型生成的视频与图片进行系统性评测，制定贴合To B业务需求的评估体系与出题策略

你将结合商业审美与行业标准，设计评测数据与评分标准，推动评估流程自动化，并协同算法与产品团队优化模型效果

适合对AI生成内容有浓厚兴趣、具备审美和逻辑分析能力的技术人才

最低要求

本科及以上学历，影视、美学、动画、广告、新媒体、设计等相关专业背景优先

具备商业审美并对细节敏感，理解B端视频/图片生成场景的商业需求及质量痛点，有视觉生成操作经验优先

有视觉内容评估经验与模型负面案例归因分析经验，能独立完成构建评测集以及评测题目优先

具备成熟的Prompt Engineering与Workflow构建能力，能够推动评估自动化流程落地

熟悉多模态大模型（如视频生成、图像生成）的技术原理与常见局限，具备质量归因能力或实践经验，并能够体系化输出相关分析结果或方法论

表达逻辑清晰，协作能力强，能够高效协同产品、算法、标注等团队，将评估结果转化为模型优化建议

工作职责

负责对多模态大模型生成的视频与图片进行系统性评测，制定贴合To B业务需求的评估体系与出题策略

结合商业审美与行业标准，设计符合To B场景的评测数据、质量评估维度与评分标准，推动评估流程的自动化与标准化

深入分析生成视频/图片的质量问题，精准归因问题来源，协同算法与产品团队提出优化建议

具备Prompt Engineering与Workflow构造能力，将主观审美与质量判断转化为可量化评估指标

持续跟踪生成模型技术进展，结合实际业务需求更新评测方法与出题策略

AI 洞察

优缺点分析

优点

在字节跳动头部平台接触前沿AI技术（多模态生成），积累宝贵经验
参与制定B端评测标准，提升个人在行业内的专业影响力
薪资福利优厚，职业发展空间大，团队技术氛围浓厚
评测工作需要高度细致和耐心，工作强度可能较大
技术更新迅速，需要持续学习以保持竞争力
跨团队协作要求沟通能力突出，需处理多方需求
适合对AI生成内容有浓厚兴趣、具备审美和逻辑分析能力，且希望在大厂深耕AI评测领域的技术人才

缺点 / 挑战

暂无明显挑战项

角色解读

深耕AI评测领域，成为评测专家或技术Leader，定义行业标准
转向AI产品经理或算法研究方向，利用评测经验推动产品迭代
在字节跳动内部横向发展，进入数据安全、AI应用或商业化等方向
设计并执行多模态大模型（视频/图片生成）的系统性评测方案，包括制定评估维度和评分标准
分析模型生成内容的质量问题，定位缺陷根因，并协同算法与产品团队推动优化
利用Prompt Engineering和Workflow自动化评估流程，提升效率与一致性
跟踪最新生成模型技术进展，持续更新评测方法与策略
熟悉多模态大模型（如视频生成、图像生成）的技术原理与常见局限，具备质量归因能力
具备商业审美和对细节的敏感度，能够将主观审美转化为可量化评估指标
精通Prompt Engineering与Workflow构建，能推动自动化评估落地
逻辑清晰，协作能力强，能高效跨团队沟通

申请策略

在简历中附作品集或评测报告样例，证明实操能力
提前了解字节跳动AI数据与安全部门的业务方向，面试中展示业务匹配度
突出视觉内容评估或模型评测相关项目经验，包括数据集构建、指标设计等
强调Prompt Engineering和自动化工具使用案例，展示技术落地能力
展示对多模态大模型的理解，如论文复现、模型对比分析等
体现商业审美和B端业务理解，如曾参与商业视觉项目
学习更系统的评估方法论，如自动化评测框架和统计分析方法
掌握视频/图像生成技术原理，了解主流模型（如Sora, Stable Video Diffusion）的优缺点

面试指南

明确评测目标，设计多维度指标体系（客观+主观），并规划自动化执行流程
通过用户调研、专家评分和数据分析结合的方式量化主观指标，如使用CMOS评分
按照“问题发现-假设验证-根因定位-解决方案”结构描述案例，体现逻辑链
如何为一个视频生成模型设计一套完整的评测方案？
如何将主观审美（如“画面质感”）量化为可衡量的指标？
描述一个你发现并归因模型缺陷的案例，包括分析过程和最终结论
你如何保证评测结果的可靠性和可重复性？
对当前主流视频生成模型（如Sora、Runway）有什么看法？你认为它们的主要局限是什么？

职位点评

综合评分

字节跳动AI评测专家，前沿技术栈，薪资优厚，但办公地点固定且可能加班。

更适合这类人

适合追求技术成长和薪资回报，能接受一定工作强度的求职者。

表现最好

成长发展

相对薄弱

工作生活

薪资福利80

成长发展85

工作生活60

使命价值70

薪资福利

80较高

字节跳动提供有竞争力的薪资和福利，但JD未具体披露，评分偏正面。

薪资信号未披露（AI估算：30K-50K/月）

成长发展

85较高

多模态大模型属于前沿技术，职位涉及评估体系设计，有较大成长空间，但JD未明确培训或晋升路径。

技术前沿前沿/新兴技术

技术栈多模态大模型、视频生成、图片生成、Prompt Engineering、Workflow

业务类型profit_center

工作生活

60中等

北京现场办公，未提及灵活工作安排，可能有一定工作强度。

工作模式仅现场办公

办公地点市区核心地段

加班情况未提及（无法判断）

使命价值

70中等

AI行业高速增长，但职位本身社会影响力中性，创新性属于积极采用新技术。

行业发展高速增长赛道

社会影响中性/一般

创新程度积极采用新技术

Watch Jobs

字节跳动

大模型自动评测专家（ToB图片/视频生成方向）-AI数据与安全

立即应聘

大模型自动评测专家（ToB图片/视频生成方向）-AI数据与安全

发布于大约 2 个月前

普通员工/个人贡献者

北京市

中级经验

全职员工

仅现场办公

本科

研究与开发 (研发)

Prompt Engineering

Workflow

商业审美

图片生成

多模态大模型

归因分析

模型优化

自动化

视频生成

AI 估算 · 30k–50k

AI大模型方向紧缺，字节跳动薪资竞争力强，预计月薪3-5万，15薪

职位详情

关于这个职位

该职位负责对多模态大模型生成的视频与图片进行系统性评测，制定贴合To B业务需求的评估体系与出题策略

你将结合商业审美与行业标准，设计评测数据与评分标准，推动评估流程自动化，并协同算法与产品团队优化模型效果

适合对AI生成内容有浓厚兴趣、具备审美和逻辑分析能力的技术人才

最低要求

本科及以上学历，影视、美学、动画、广告、新媒体、设计等相关专业背景优先

具备商业审美并对细节敏感，理解B端视频/图片生成场景的商业需求及质量痛点，有视觉生成操作经验优先

有视觉内容评估经验与模型负面案例归因分析经验，能独立完成构建评测集以及评测题目优先

具备成熟的Prompt Engineering与Workflow构建能力，能够推动评估自动化流程落地

熟悉多模态大模型（如视频生成、图像生成）的技术原理与常见局限，具备质量归因能力或实践经验，并能够体系化输出相关分析结果或方法论

表达逻辑清晰，协作能力强，能够高效协同产品、算法、标注等团队，将评估结果转化为模型优化建议

工作职责

负责对多模态大模型生成的视频与图片进行系统性评测，制定贴合To B业务需求的评估体系与出题策略

结合商业审美与行业标准，设计符合To B场景的评测数据、质量评估维度与评分标准，推动评估流程的自动化与标准化

深入分析生成视频/图片的质量问题，精准归因问题来源，协同算法与产品团队提出优化建议

具备Prompt Engineering与Workflow构造能力，将主观审美与质量判断转化为可量化评估指标

持续跟踪生成模型技术进展，结合实际业务需求更新评测方法与出题策略

AI 洞察

优缺点分析

优点

在字节跳动头部平台接触前沿AI技术（多模态生成），积累宝贵经验
参与制定B端评测标准，提升个人在行业内的专业影响力
薪资福利优厚，职业发展空间大，团队技术氛围浓厚
评测工作需要高度细致和耐心，工作强度可能较大
技术更新迅速，需要持续学习以保持竞争力
跨团队协作要求沟通能力突出，需处理多方需求
适合对AI生成内容有浓厚兴趣、具备审美和逻辑分析能力，且希望在大厂深耕AI评测领域的技术人才

缺点 / 挑战

暂无明显挑战项

角色解读

深耕AI评测领域，成为评测专家或技术Leader，定义行业标准
转向AI产品经理或算法研究方向，利用评测经验推动产品迭代
在字节跳动内部横向发展，进入数据安全、AI应用或商业化等方向
设计并执行多模态大模型（视频/图片生成）的系统性评测方案，包括制定评估维度和评分标准
分析模型生成内容的质量问题，定位缺陷根因，并协同算法与产品团队推动优化
利用Prompt Engineering和Workflow自动化评估流程，提升效率与一致性
跟踪最新生成模型技术进展，持续更新评测方法与策略
熟悉多模态大模型（如视频生成、图像生成）的技术原理与常见局限，具备质量归因能力
具备商业审美和对细节的敏感度，能够将主观审美转化为可量化评估指标
精通Prompt Engineering与Workflow构建，能推动自动化评估落地
逻辑清晰，协作能力强，能高效跨团队沟通

申请策略

在简历中附作品集或评测报告样例，证明实操能力
提前了解字节跳动AI数据与安全部门的业务方向，面试中展示业务匹配度
突出视觉内容评估或模型评测相关项目经验，包括数据集构建、指标设计等
强调Prompt Engineering和自动化工具使用案例，展示技术落地能力
展示对多模态大模型的理解，如论文复现、模型对比分析等
体现商业审美和B端业务理解，如曾参与商业视觉项目
学习更系统的评估方法论，如自动化评测框架和统计分析方法
掌握视频/图像生成技术原理，了解主流模型（如Sora, Stable Video Diffusion）的优缺点

面试指南

明确评测目标，设计多维度指标体系（客观+主观），并规划自动化执行流程
通过用户调研、专家评分和数据分析结合的方式量化主观指标，如使用CMOS评分
按照“问题发现-假设验证-根因定位-解决方案”结构描述案例，体现逻辑链
如何为一个视频生成模型设计一套完整的评测方案？
如何将主观审美（如“画面质感”）量化为可衡量的指标？
描述一个你发现并归因模型缺陷的案例，包括分析过程和最终结论
你如何保证评测结果的可靠性和可重复性？
对当前主流视频生成模型（如Sora、Runway）有什么看法？你认为它们的主要局限是什么？

职位点评

综合评分

字节跳动AI评测专家，前沿技术栈，薪资优厚，但办公地点固定且可能加班。

更适合这类人

适合追求技术成长和薪资回报，能接受一定工作强度的求职者。

表现最好

成长发展

相对薄弱

工作生活

薪资福利80

成长发展85

工作生活60

使命价值70

薪资福利

80较高

字节跳动提供有竞争力的薪资和福利，但JD未具体披露，评分偏正面。

薪资信号未披露（AI估算：30K-50K/月）

成长发展

85较高

多模态大模型属于前沿技术，职位涉及评估体系设计，有较大成长空间，但JD未明确培训或晋升路径。

技术前沿前沿/新兴技术

技术栈多模态大模型、视频生成、图片生成、Prompt Engineering、Workflow

业务类型profit_center

工作生活

60中等

北京现场办公，未提及灵活工作安排，可能有一定工作强度。

工作模式仅现场办公

办公地点市区核心地段

加班情况未提及（无法判断）

使命价值

70中等

AI行业高速增长，但职位本身社会影响力中性，创新性属于积极采用新技术。

行业发展高速增长赛道

社会影响中性/一般

创新程度积极采用新技术

Watch Jobs

大模型自动评测专家（ToB图片/视频生成方向）-AI数据与安全

职位详情

关于这个职位

最低要求

工作职责

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

大模型自动评测专家（ToB图片/视频生成方向）-AI数据与安全

职位详情

关于这个职位

最低要求

工作职责

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

字节跳动 的其他在招职位

短剧安全应急处置负责人-CQC

服饰KA商业化（男装）-抖音电商

成长型客户销售经理（AI&企业服务）-火山引擎

策略运营（主播运营方向）-TikTok直播

高级前端开发工程师（直播活动研发方向）-TikTok直播

相似职位推荐

腾讯云DataBuddy -大模型算法专家

灰境行者-资深数值策划

Agent算法实习生-2027届

顶尖应届-广告算法工程师-互联网

AI软件开发工程师实习生-2027届

字节跳动 的其他在招职位

短剧安全应急处置负责人-CQC

服饰KA商业化（男装）-抖音电商

成长型客户销售经理（AI&企业服务）-火山引擎

策略运营（主播运营方向）-TikTok直播

高级前端开发工程师（直播活动研发方向）-TikTok直播

相似职位推荐

腾讯云DataBuddy -大模型算法专家

灰境行者-资深数值策划

Agent算法实习生-2027届

顶尖应届-广告算法工程师-互联网

AI软件开发工程师实习生-2027届

字节跳动的其他在招职位

字节跳动的其他在招职位