Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
AI数据运营专家(数理评测方向)-大模型数据服务中心
立即应聘

AI数据运营专家(数理评测方向)-大模型数据服务中心

发布于 大约 14 小时前

普通员工/个人贡献者

北京市
中级经验
全职员工
仅现场办公
本科
跨团队协作
项目管理
数据分析
LLM
数据运营
AI评估
大模型
评测标准

AI 估算 · 25k–40k

AI大模型方向热门,字节跳动大厂薪资竞争力强,中高级岗位月薪约2.5-4万。

职位详情

关于这个职位

该职位负责AI大模型在理科方向的评估标准制定与评测,管理LLM训练项目,协同研发团队推进数据运营优化

适合有数学、计算机等理科背景,对AI评估有热情,擅长跨团队协作的数据分析或产品人才

最低要求

本科及以上学历,数学、计算机、大数据等理科类专业优先

优秀的跨团队沟通与协作能力,能快速建立信任并推动内外部合作
具备数据产品或数据分析相关经验,同时对大模型标注、评测有认知,能够及时发现业务问题,并制定解决方案
对LLMs、AI训练数据的有热情,深入理解业务逻辑与模型使用场景,对业内最新论文和技术报告有关注和探索

工作职责

制定AI模型评估在理科方向的评估标准,调研公开评测方法并撰写评估报告,主导评估体系构建、AI模型评估方案等工作

负责多个理科类LLM训练项目,协同产品研发及其他团队,建立良好协作关系,跟踪项目进展并识别风险、处置风险,完成约定交付
管理训练项目、训练数据流程,完成训练设计、效果追踪以满足项目需求,主导通用标注运营优化,提升数据运营效率,确保生产质量

AI 洞察

优缺点分析

优点

  • 身处AI大模型核心赛道,技术前沿,个人成长快
  • 字节跳动平台资源丰富,能接触大规模数据和先进技术
  • 工作内容结合技术与业务,培养复合型能力
  • AI领域发展迅速,需持续学习最新论文和技术,保持知识更新
  • 项目管理任务重,跨团队协作沟通成本高,需较强抗压能力
  • 工作节奏可能较快,需要适应高强度迭代
  • 适合有理科背景,对AI评估和数据分析有热情,善于沟通协调,并希望在AI大模型领域深入发展的求职者

缺点 / 挑战

暂无明显挑战项

角色解读

  • 成长为AI评估领域的专家,主导大模型评测体系构建
  • 向数据运营管理或AI产品经理方向发展,负责更大规模的项目
  • 积累深度技术理解后,可转型为AI研究员或技术策略岗
  • 制定AI模型在理科方向的评估标准,调研公开评测方法并撰写评估报告
  • 主导LLM训练项目,跨团队协作推进项目进展,跟踪风险并完成交付
  • 管理训练数据流程,优化标注运营效率,确保数据质量
  • 具备数学、计算机等理科背景,理解AI模型评估逻辑
  • 优秀的数据分析或数据产品经验,能发现业务问题并制定方案
  • 对LLM和AI训练数据有热情,持续关注最新论文和技术
  • 出色的跨团队沟通与协作能力,能推动多方合作

申请策略

  • 在申请中展示对AI评估的热情和见解,例如写一段对当前评测方法的思考
  • 关注字节跳动在AI大模型领域的最新动态,面试中结合业务讨论
  • 突出数据产品或数据分析项目经验,尤其是与AI评估或标注相关的成果
  • 强调跨团队协作案例,展示推动项目落地的能力
  • 提及对LLM的了解和关注,如阅读过的论文、参与过的评测等
  • 体现理科背景,如数学、统计、计算机等专业课程或研究
  • 补充AI模型评估方法的知识,如BLEU、ROUGE、Human Evaluation等
  • 熟悉常用大模型产品(如ChatGPT、文心一言)并了解其训练数据流程

面试指南

  • 结合具体例子,用STAR法则描述项目背景、任务、行动和结果
  • 对于评估方法,先说明通用指标,再根据任务特点补充专用指标
  • 展示持续学习的态度,引用具体论文或技术趋势
  • 请谈谈你如何评估一个LLM在数学推理任务上的表现?
  • 描述一次你跨团队协作推进项目并解决风险的经历
  • 你对大模型标注数据质量管控有什么经验或想法?
  • 最近读了哪些AI论文?它们对评测方法有何启发?
  • 复习LLM的核心概念,如预训练、微调、RLHF等,并能解释评测挑战

匹配度报告

71
综合匹配度

字节AI大模型评估岗位,高成长性,薪资竞争力强,但现场办公且强度可能较大。

适合人群
最适合追求技术成长和职业发展的求职者,对WLB要求不高。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利75
成长发展90
工作生活50
使命价值70

薪资福利匹配

75中等

字节跳动为上市公司,薪资具有竞争力,福利完善,但JD未明确说明具体薪资和福利。

薪资信号未披露(AI估算:25K-40K/月)

成长发展匹配

90较高

职位处于AI大模型前沿领域,能接触最新技术和方法,且有明确的成长机会,JD提到对最新论文和技术报告有探索。

技术前沿前沿/新兴技术
技术栈LLM、AI评估、大模型、训练数据
业务类型ambiguous

工作生活匹配

50较低

仅现场办公,未提及弹性或远程,互联网大厂通常工作强度较大,WLB可能一般。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

70中等

AI大模型是高速增长赛道,对社会有较大影响力,但JD未明确使命信号。

行业发展高速增长赛道
社会影响正向社会影响力较高
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 品牌广告产品经理(品牌竞价方向)-中国商业产品与技术(北京/上海)

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 商品策略运营(作者方向)-抖音电商

    字节跳动 · 北京市
    AI 估算 · 20k-40k
  • 高级抖音用户产品经理-汽水音乐

    字节跳动 · 北京市
    AI 估算 · 25k-40k
  • iOS资深研发工程师-TikTok搜索

    字节跳动 · 上海市
    AI 估算 · 30k-50k
  • 平台治理前端开发工程师-生活服务

    字节跳动 · 上海市
    AI 估算 · 25k-45k

相似职位推荐

  • AI Agent算法专家(智能创作方向)

    快手 · 北京市
    AI 估算 · 35k-55k
  • Function & Baseline Management

    大众汽车 · 合肥市
    AI 估算 · 20k-30k
  • 【26年度台湾地区青年实习】机械制造设计(东航资产)

    中国东方航空 · 上海市
    AI 估算 · 4k-6k
  • 大模型应用评测算法工程师

    美团 · 北京市
    AI 估算 · 25k-45k

字节跳动 的其他在招职位

  • 品牌广告产品经理(品牌竞价方向)-中国商业产品与技术(北京/上海)

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 商品策略运营(作者方向)-抖音电商

    字节跳动 · 北京市
    AI 估算 · 20k-40k
  • 高级抖音用户产品经理-汽水音乐

    字节跳动 · 北京市
    AI 估算 · 25k-40k
  • iOS资深研发工程师-TikTok搜索

    字节跳动 · 上海市
    AI 估算 · 30k-50k
  • 平台治理前端开发工程师-生活服务

    字节跳动 · 上海市
    AI 估算 · 25k-45k

相似职位推荐

  • AI Agent算法专家(智能创作方向)

    快手 · 北京市
    AI 估算 · 35k-55k
  • Function & Baseline Management

    大众汽车 · 合肥市
    AI 估算 · 20k-30k
  • 【26年度台湾地区青年实习】机械制造设计(东航资产)

    中国东方航空 · 上海市
    AI 估算 · 4k-6k
  • 大模型应用评测算法工程师

    美团 · 北京市
    AI 估算 · 25k-45k