Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

ByteDance logo
字节跳动
AI大模型评估专家(写作方向)-AI数据与安全
立即应聘

AI大模型评估专家(写作方向)-AI数据与安全

发布于 1 天前

普通员工/个人贡献者

北京市
中级经验
全职员工
仅现场办公
本科
研究与开发 (研发)
项目管理
数据分析
内容创作
自动化评估
大语言模型
AI评估
提示词工程
写作评测

AI 估算 · 20k–35k

大厂AI岗位,技能要求高,市场竞争激烈,薪资位于行业高位。

职位详情

关于这个职位

作为AI大模型评估专家(写作方向),你将负责大语言模型写作能力的评测工作,与产品和研发团队紧密协作,优化评估流程与标准

通过交付高质量的评测报告和自动评估体系,牵引模型优化方向,推动模型与用户需求对齐
适合对AI写作有深度热情、具备内容品味和项目管理能力的复合型人才

最低要求

本科及以上学历,计算语言学、中文、编剧、社会学、新闻学或人工智能、计算机等专业,有理工和人文交叉背景优先

AI产品的深度用户,对AI写作和大语言模型有高度热情,掌握基础的提示词工程,会搭建Workflow和Agent优先,掌握基础的代码能力优先
有很好的内容品味,对某几类体裁有较深度的理解和认知,包括但不限于论文/文案/公文/教案/诗歌/小说等
具备出色的项目管理能力,能与产品、研发、数据等多部门协同,对齐需求并推动多项任务高质高效交付
拥有出色的逻辑思维和问题解决能力,沟通表达清晰,学习能力强,细心严谨,有责任心

工作职责

负责大语言模型写作方向的评测工作,与产品研发协同迭代人工评估的流程和标准,通过交付高质量的评测/众测/AB实验报告,发现模型问题,为模型优化提供牵引

持续探索自动评估的思路和方法,搭建自动评估的体系,提升自动评估与人工评估的一致率,提高模型评估的吞吐量和效率
从用户端到端体验和模型理想态出发,构建迭代人工和自动评估题库,推动评估与用户需求对齐

AI 洞察

优缺点分析

优点

  • 深度参与前沿大语言模型(LLM)的迭代,积累AI领域的核心经验
  • 字节跳动平台提供海量数据和用户场景,项目影响力大
  • 技能复合性强(技术+内容+管理),职业发展路径宽
  • 需要同时具备技术和内容敏感度,对综合素质要求高
  • 大模型迭代快速,需持续学习新工具和方法,工作节奏较快
  • 适合对AI写作有浓厚兴趣、兼具逻辑思维和内容品味、喜欢在技术与人文交叉领域工作的求职者

缺点 / 挑战

  • 评估工作可能涉及重复性任务,需保持细致和耐心

角色解读

  • 纵向发展:成为AI评估专家,主导大型模型评估体系设计,或转向数据科学、AI产品经理方向
  • 横向扩展:深入了解大模型技术栈,可转岗模型训练、算法优化或AI应用开发
  • 管理路线:晋升为评估团队负责人,带领团队负责多业务线评测工作
  • 设计并执行大语言模型写作能力的评测方案,包括人工评估和自动评估,产出评测报告以驱动模型迭代
  • 协同产品、研发和数据团队,优化评估标准和流程,确保评估结果与用户需求对齐
  • 搭建自动评估体系,提升评估效率和一致性,减少人工成本
  • 构建和维护评估题库,覆盖多种写作体裁,如论文、文案、小说等
  • 需要扎实的提示词工程(Prompt Engineering)能力,能够设计高效的评估用例
  • 具备内容创作或文学素养,对多种体裁有深度理解,能判断文本质量
  • 掌握基础代码能力(如Python),熟悉自动化评估工具和Workflow搭建
  • 出色的项目管理和跨部门协同能力,能够推动复杂任务落地

申请策略

  • 在面试中准备一个详细的AI写作评测方案,展示你的思路和逻辑
  • 了解字节跳动旗下AI产品(如豆包),提前体验并思考改进点
  • 突出AI产品使用经验,特别是对ChatGPT、Claude等大模型的深度体验和评测案例
  • 展示内容创作作品集,如文章、剧本、文案等,体现内容品味和多样化能力
  • 强调项目管理或协同项目经验,尤其是跨部门推动落地的成果
  • 列出技术技能,如Python、Prompt Engineering、自动化脚本等
  • 深入学习提示词工程和Agent/Workflow搭建,如LangChain、AutoGPT等
  • 提升编程能力,熟练掌握Python数据处理和自动化框架

面试指南

  • STAR法则:描述情境、任务、行动和结果,重点突出逻辑和解决方案
  • 分维度回答:对于评估类问题,从准确性、流畅性、创造性、用户满意度等维度展开
  • 结合数据:提及量化指标(如一致率、通过率)和迭代方法
  • 如何设计一个评估方案来衡量大语言模型在公文写作上的表现?
  • 你如何判断一篇AI生成的文案质量?有哪些维度和指标?
  • 请描述你使用Prompt Engineering改进模型输出的一个实际案例
  • 当人工评估和自动评估结果不一致时,你会如何分析和解决?
  • 如何在多项目并行时确保评测任务的高质量交付?

职位点评

74
综合评分

大厂AI核心岗,前沿技术栈,高薪资高成长,但办公灵活性和WLB一般。

更适合这类人
最适合追求技术成长和职业发展的求职者,对工作生活平衡要求不高。
表现最好
成长发展
相对薄弱
工作生活
薪资福利85
成长发展90
工作生活50
使命价值70

薪资福利

85较高

字节跳动薪资在互联网大厂中处于高位,且该岗位技能稀缺,预计薪资有竞争力,福利完善。

薪资信号未披露(AI估算:20K-35K/月)

成长发展

90较高

岗位涉及前沿大模型技术,能深度参与AI产品迭代,技能成长空间大,但未明确提及晋升路径。

技术前沿前沿/新兴技术
技术栈大语言模型、提示词工程、Workflow、Agent、自动化评估
业务类型profit_center

工作生活

50较低

大厂通常工作节奏较快,未提及远程或弹性办公,北京办公通勤成本高。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值

70中等

AI行业高速增长,岗位直接影响大模型质量和用户体验,社会价值显著,但未强调使命感。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 客户端安全工程师

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 区域配送商务Leader-TikTok Shop

    字节跳动 · 上海市
    AI 估算 · 50k-80k
  • 零售行业高级解决方案经理-火山引擎

    字节跳动 · 北京市
    AI 估算 · 30k-50k
  • C端内容产品设计师-生活服务(上海)

    字节跳动 · 上海市
    AI 估算 · 20k-40k
  • 云原生产品专家-微服务

    字节跳动 · 上海市
    AI 估算 · 35k-60k

相似职位推荐

  • Early Talent Leadership Development Program - Engineering and Technology

    伊顿中国 · 上海市
    AI 估算 · 15k-25k
  • ACB Lead Engineer

    伊顿中国 · 苏州市
    AI 估算 · 20k-35k
  • Lead Product Engineer

    伊顿中国 · 上海市
    AI 估算 · 25k-40k
  • Early Talent Leadership Development Program - Engineering and Technology

    伊顿中国 · 上海市
    AI 估算 · 15k-25k
  • Head of Application Engineering

    德科斯米尔 · 沈阳市
    AI 估算 · 25k-45k

字节跳动 的其他在招职位

  • 客户端安全工程师

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 区域配送商务Leader-TikTok Shop

    字节跳动 · 上海市
    AI 估算 · 50k-80k
  • 零售行业高级解决方案经理-火山引擎

    字节跳动 · 北京市
    AI 估算 · 30k-50k
  • C端内容产品设计师-生活服务(上海)

    字节跳动 · 上海市
    AI 估算 · 20k-40k
  • 云原生产品专家-微服务

    字节跳动 · 上海市
    AI 估算 · 35k-60k

相似职位推荐

  • Early Talent Leadership Development Program - Engineering and Technology

    伊顿中国 · 上海市
    AI 估算 · 15k-25k
  • ACB Lead Engineer

    伊顿中国 · 苏州市
    AI 估算 · 20k-35k
  • Lead Product Engineer

    伊顿中国 · 上海市
    AI 估算 · 25k-40k
  • Early Talent Leadership Development Program - Engineering and Technology

    伊顿中国 · 上海市
    AI 估算 · 15k-25k
  • Head of Application Engineering

    德科斯米尔 · 沈阳市
    AI 估算 · 25k-45k