字节跳动的AI大模型评估专家（写作方向）-AI数据与安全薪资是多少？

该职位薪资范围为 20k–35k（人民币/月）。

AI大模型评估专家（写作方向）-AI数据与安全的工作地点在哪里？

该职位工作地点位于北京市。工作形式为仅现场办公。

字节跳动的AI大模型评估专家（写作方向）-AI数据与安全有什么任职要求？

该职位要求本科学历及中级经验工作经验。

字节跳动

AI大模型评估专家（写作方向）-AI数据与安全

立即应聘

AI大模型评估专家（写作方向）-AI数据与安全

发布于 1 天前

普通员工/个人贡献者

北京市

中级经验

全职员工

仅现场办公

本科

研究与开发 (研发)

项目管理

数据分析

内容创作

自动化评估

大语言模型

AI评估

提示词工程

写作评测

AI 估算 · 20k–35k

大厂AI岗位，技能要求高，市场竞争激烈，薪资位于行业高位。

职位详情

关于这个职位

作为AI大模型评估专家（写作方向），你将负责大语言模型写作能力的评测工作，与产品和研发团队紧密协作，优化评估流程与标准

通过交付高质量的评测报告和自动评估体系，牵引模型优化方向，推动模型与用户需求对齐

适合对AI写作有深度热情、具备内容品味和项目管理能力的复合型人才

最低要求

本科及以上学历，计算语言学、中文、编剧、社会学、新闻学或人工智能、计算机等专业，有理工和人文交叉背景优先

AI产品的深度用户，对AI写作和大语言模型有高度热情，掌握基础的提示词工程，会搭建Workflow和Agent优先，掌握基础的代码能力优先

有很好的内容品味，对某几类体裁有较深度的理解和认知，包括但不限于论文/文案/公文/教案/诗歌/小说等

具备出色的项目管理能力，能与产品、研发、数据等多部门协同，对齐需求并推动多项任务高质高效交付

拥有出色的逻辑思维和问题解决能力，沟通表达清晰，学习能力强，细心严谨，有责任心

工作职责

负责大语言模型写作方向的评测工作，与产品研发协同迭代人工评估的流程和标准，通过交付高质量的评测/众测/AB实验报告，发现模型问题，为模型优化提供牵引

持续探索自动评估的思路和方法，搭建自动评估的体系，提升自动评估与人工评估的一致率，提高模型评估的吞吐量和效率

从用户端到端体验和模型理想态出发，构建迭代人工和自动评估题库，推动评估与用户需求对齐

AI 洞察

优缺点分析

优点

深度参与前沿大语言模型（LLM）的迭代，积累AI领域的核心经验
字节跳动平台提供海量数据和用户场景，项目影响力大
技能复合性强（技术+内容+管理），职业发展路径宽
需要同时具备技术和内容敏感度，对综合素质要求高
大模型迭代快速，需持续学习新工具和方法，工作节奏较快
适合对AI写作有浓厚兴趣、兼具逻辑思维和内容品味、喜欢在技术与人文交叉领域工作的求职者

缺点 / 挑战

评估工作可能涉及重复性任务，需保持细致和耐心

角色解读

纵向发展：成为AI评估专家，主导大型模型评估体系设计，或转向数据科学、AI产品经理方向
横向扩展：深入了解大模型技术栈，可转岗模型训练、算法优化或AI应用开发
管理路线：晋升为评估团队负责人，带领团队负责多业务线评测工作
设计并执行大语言模型写作能力的评测方案，包括人工评估和自动评估，产出评测报告以驱动模型迭代
协同产品、研发和数据团队，优化评估标准和流程，确保评估结果与用户需求对齐
搭建自动评估体系，提升评估效率和一致性，减少人工成本
构建和维护评估题库，覆盖多种写作体裁，如论文、文案、小说等
需要扎实的提示词工程（Prompt Engineering）能力，能够设计高效的评估用例
具备内容创作或文学素养，对多种体裁有深度理解，能判断文本质量
掌握基础代码能力（如Python），熟悉自动化评估工具和Workflow搭建
出色的项目管理和跨部门协同能力，能够推动复杂任务落地

申请策略

在面试中准备一个详细的AI写作评测方案，展示你的思路和逻辑
了解字节跳动旗下AI产品（如豆包），提前体验并思考改进点
突出AI产品使用经验，特别是对ChatGPT、Claude等大模型的深度体验和评测案例
展示内容创作作品集，如文章、剧本、文案等，体现内容品味和多样化能力
强调项目管理或协同项目经验，尤其是跨部门推动落地的成果
列出技术技能，如Python、Prompt Engineering、自动化脚本等
深入学习提示词工程和Agent/Workflow搭建，如LangChain、AutoGPT等
提升编程能力，熟练掌握Python数据处理和自动化框架

面试指南

STAR法则：描述情境、任务、行动和结果，重点突出逻辑和解决方案
分维度回答：对于评估类问题，从准确性、流畅性、创造性、用户满意度等维度展开
结合数据：提及量化指标（如一致率、通过率）和迭代方法
如何设计一个评估方案来衡量大语言模型在公文写作上的表现？
你如何判断一篇AI生成的文案质量？有哪些维度和指标？
请描述你使用Prompt Engineering改进模型输出的一个实际案例
当人工评估和自动评估结果不一致时，你会如何分析和解决？
如何在多项目并行时确保评测任务的高质量交付？

职位点评

综合评分

大厂AI核心岗，前沿技术栈，高薪资高成长，但办公灵活性和WLB一般。

更适合这类人

最适合追求技术成长和职业发展的求职者，对工作生活平衡要求不高。

表现最好

成长发展

相对薄弱

工作生活

薪资福利85

成长发展90

工作生活50

使命价值70

薪资福利

85较高

字节跳动薪资在互联网大厂中处于高位，且该岗位技能稀缺，预计薪资有竞争力，福利完善。

薪资信号未披露（AI估算：20K-35K/月）

成长发展

90较高

岗位涉及前沿大模型技术，能深度参与AI产品迭代，技能成长空间大，但未明确提及晋升路径。

技术前沿前沿/新兴技术

技术栈大语言模型、提示词工程、Workflow、Agent、自动化评估

业务类型profit_center

工作生活

50较低

大厂通常工作节奏较快，未提及远程或弹性办公，北京办公通勤成本高。

工作模式仅现场办公

办公地点市区核心地段

加班情况未提及（无法判断）

使命价值

70中等

AI行业高速增长，岗位直接影响大模型质量和用户体验，社会价值显著，但未强调使命感。

行业发展高速增长赛道

社会影响中性/一般

创新程度积极采用新技术

Watch Jobs

字节跳动

AI大模型评估专家（写作方向）-AI数据与安全

立即应聘

AI大模型评估专家（写作方向）-AI数据与安全

发布于 1 天前

普通员工/个人贡献者

北京市

中级经验

全职员工

仅现场办公

本科

研究与开发 (研发)

项目管理

数据分析

内容创作

自动化评估

大语言模型

AI评估

提示词工程

写作评测

AI 估算 · 20k–35k

大厂AI岗位，技能要求高，市场竞争激烈，薪资位于行业高位。

职位详情

关于这个职位

作为AI大模型评估专家（写作方向），你将负责大语言模型写作能力的评测工作，与产品和研发团队紧密协作，优化评估流程与标准

通过交付高质量的评测报告和自动评估体系，牵引模型优化方向，推动模型与用户需求对齐

适合对AI写作有深度热情、具备内容品味和项目管理能力的复合型人才

最低要求

本科及以上学历，计算语言学、中文、编剧、社会学、新闻学或人工智能、计算机等专业，有理工和人文交叉背景优先

AI产品的深度用户，对AI写作和大语言模型有高度热情，掌握基础的提示词工程，会搭建Workflow和Agent优先，掌握基础的代码能力优先

有很好的内容品味，对某几类体裁有较深度的理解和认知，包括但不限于论文/文案/公文/教案/诗歌/小说等

具备出色的项目管理能力，能与产品、研发、数据等多部门协同，对齐需求并推动多项任务高质高效交付

拥有出色的逻辑思维和问题解决能力，沟通表达清晰，学习能力强，细心严谨，有责任心

工作职责

持续探索自动评估的思路和方法，搭建自动评估的体系，提升自动评估与人工评估的一致率，提高模型评估的吞吐量和效率

从用户端到端体验和模型理想态出发，构建迭代人工和自动评估题库，推动评估与用户需求对齐

AI 洞察

优缺点分析

优点

深度参与前沿大语言模型（LLM）的迭代，积累AI领域的核心经验
字节跳动平台提供海量数据和用户场景，项目影响力大
技能复合性强（技术+内容+管理），职业发展路径宽
需要同时具备技术和内容敏感度，对综合素质要求高
大模型迭代快速，需持续学习新工具和方法，工作节奏较快
适合对AI写作有浓厚兴趣、兼具逻辑思维和内容品味、喜欢在技术与人文交叉领域工作的求职者

缺点 / 挑战

评估工作可能涉及重复性任务，需保持细致和耐心

角色解读

纵向发展：成为AI评估专家，主导大型模型评估体系设计，或转向数据科学、AI产品经理方向
横向扩展：深入了解大模型技术栈，可转岗模型训练、算法优化或AI应用开发
管理路线：晋升为评估团队负责人，带领团队负责多业务线评测工作
设计并执行大语言模型写作能力的评测方案，包括人工评估和自动评估，产出评测报告以驱动模型迭代
协同产品、研发和数据团队，优化评估标准和流程，确保评估结果与用户需求对齐
搭建自动评估体系，提升评估效率和一致性，减少人工成本
构建和维护评估题库，覆盖多种写作体裁，如论文、文案、小说等
需要扎实的提示词工程（Prompt Engineering）能力，能够设计高效的评估用例
具备内容创作或文学素养，对多种体裁有深度理解，能判断文本质量
掌握基础代码能力（如Python），熟悉自动化评估工具和Workflow搭建
出色的项目管理和跨部门协同能力，能够推动复杂任务落地

申请策略

在面试中准备一个详细的AI写作评测方案，展示你的思路和逻辑
了解字节跳动旗下AI产品（如豆包），提前体验并思考改进点
突出AI产品使用经验，特别是对ChatGPT、Claude等大模型的深度体验和评测案例
展示内容创作作品集，如文章、剧本、文案等，体现内容品味和多样化能力
强调项目管理或协同项目经验，尤其是跨部门推动落地的成果
列出技术技能，如Python、Prompt Engineering、自动化脚本等
深入学习提示词工程和Agent/Workflow搭建，如LangChain、AutoGPT等
提升编程能力，熟练掌握Python数据处理和自动化框架

面试指南

STAR法则：描述情境、任务、行动和结果，重点突出逻辑和解决方案
分维度回答：对于评估类问题，从准确性、流畅性、创造性、用户满意度等维度展开
结合数据：提及量化指标（如一致率、通过率）和迭代方法
如何设计一个评估方案来衡量大语言模型在公文写作上的表现？
你如何判断一篇AI生成的文案质量？有哪些维度和指标？
请描述你使用Prompt Engineering改进模型输出的一个实际案例
当人工评估和自动评估结果不一致时，你会如何分析和解决？
如何在多项目并行时确保评测任务的高质量交付？

职位点评

综合评分

大厂AI核心岗，前沿技术栈，高薪资高成长，但办公灵活性和WLB一般。

更适合这类人

最适合追求技术成长和职业发展的求职者，对工作生活平衡要求不高。

表现最好

成长发展

相对薄弱

工作生活

薪资福利85

成长发展90

工作生活50

使命价值70

薪资福利

85较高

字节跳动薪资在互联网大厂中处于高位，且该岗位技能稀缺，预计薪资有竞争力，福利完善。

薪资信号未披露（AI估算：20K-35K/月）

成长发展

90较高

岗位涉及前沿大模型技术，能深度参与AI产品迭代，技能成长空间大，但未明确提及晋升路径。

技术前沿前沿/新兴技术

技术栈大语言模型、提示词工程、Workflow、Agent、自动化评估

业务类型profit_center

工作生活

50较低

大厂通常工作节奏较快，未提及远程或弹性办公，北京办公通勤成本高。

工作模式仅现场办公

办公地点市区核心地段

加班情况未提及（无法判断）

使命价值

70中等

AI行业高速增长，岗位直接影响大模型质量和用户体验，社会价值显著，但未强调使命感。

行业发展高速增长赛道

社会影响中性/一般

创新程度积极采用新技术

Watch Jobs

AI大模型评估专家（写作方向）-AI数据与安全

职位详情

关于这个职位

最低要求

工作职责

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

AI大模型评估专家（写作方向）-AI数据与安全

职位详情

关于这个职位

最低要求

工作职责

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

字节跳动 的其他在招职位

客户端安全工程师

区域配送商务Leader-TikTok Shop

零售行业高级解决方案经理-火山引擎

C端内容产品设计师-生活服务（上海）

云原生产品专家-微服务

相似职位推荐

Early Talent Leadership Development Program - Engineering and Technology

ACB Lead Engineer

Lead Product Engineer

Early Talent Leadership Development Program - Engineering and Technology

Head of Application Engineering

字节跳动 的其他在招职位

客户端安全工程师

区域配送商务Leader-TikTok Shop

零售行业高级解决方案经理-火山引擎

C端内容产品设计师-生活服务（上海）

云原生产品专家-微服务

相似职位推荐

Early Talent Leadership Development Program - Engineering and Technology

ACB Lead Engineer

Lead Product Engineer

Early Talent Leadership Development Program - Engineering and Technology

Head of Application Engineering

字节跳动的其他在招职位

字节跳动的其他在招职位