Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
Agent数据评测运营专家(Agent/FC方向)-AI数据与安全
立即应聘

Agent数据评测运营专家(Agent/FC方向)-AI数据与安全

发布于 大约 19 小时前

普通员工/个人贡献者

北京市
专家级经验
全职员工
仅现场办公
本科
提示工程
大模型
数据评测
Workflow
Ai数据

AI 估算 · 40k–60k

字节跳动专家级别,AI数据赛道火热,技能要求高,薪资竞争力强,预估月薪40-60K。

职位详情

关于这个职位

该职位负责构建Agent/模型的数据评测体系,包括数据构建、校验和效果评测,以支持Agent与Function Calling能力的迭代

你将与产品、算法、工程团队紧密协作,提供定制化数据解决方案,并探索前沿数据评测方法,推动AI模型体验和迭代效率的提升
适合对大数据和AI评测有热情、具备技术背景的同学

最低要求

本科及以上学历,熟悉Python、提示工程、Agent、Workflow、Function Call

对大模型数据/评测解决方案有探索热情,具有大模型产品、数据、研发、评测等相关经验
具备较好的团队协作能力和责任心,能独立且带队完成工作任务

工作职责

负责数据/评测体系构建:梳理通用Agent/模型工具调用能力(Function Calling)业务场景数据需求,构建覆盖全生命周期的数据构建体系、校验体系、效果评测体系,确保数据和评测解决方案高效、可靠,为Agent/模型迭代提供有效的数据支撑

负责数据/评测驱动的迭代协同:与产品、算法、工程团队紧密协作,深入参与到Agent/模型迭代的整体流程中,提供定制化的数据和评测解决方案,助力Agent/模型持续迭代升级
负责前沿数据/评测方案探索与落地:关注大模型与Agent领域前沿数据构建和效果评测的技术与方法论,探索数据/评测驱动AI发展的创新模式,结合业务实际,将前沿的数据、评测、分析方法落地应用于实际业务中,通过优化数据质量、提升数据构造效率和迭代评价手段,提升Agent/模型使用体验和迭代效率

AI 洞察

优缺点分析

优点

  • 身处AI大模型核心赛道,接触前沿技术,职业天花板高
  • 字节跳动平台大,资源丰富,数据与场景优势明显
  • 工作内容兼具技术与业务导向,能快速积累实战经验
  • 工作强度较大,可能面临快速迭代和高压项目周期
  • 技术要求全面,需要同时掌握工程、数据和AI模型知识
  • 适合对AI数据、模型评测有热情,具备技术背景且乐于跨团队协作的求职者

缺点 / 挑战

  • 评测体系构建需要较强抽象和系统化思维,有一定挑战性

角色解读

  • 向AI数据与评测领域专家发展,成为数据策略或模型评估方向的核心负责人
  • 横向拓展至大模型产品经理或算法工程师,积累端到端模型迭代经验
  • 在字节跳动内部可晋升为技术Leader或转岗至其他AI业务线
  • 构建Agent和模型的数据与评测体系,包括数据需求梳理、标注规范制定、效果评估方法设计
  • 与产品、算法、工程团队协作,推动数据驱动的模型迭代优化,解决实际业务问题
  • 跟踪前沿技术,探索新的数据构建和评测方法,提升Agent使用体验和迭代效率
  • 扎实的Python编程能力,熟悉Prompt Engineering、Agent、Workflow和Function Call等技术
  • 对大模型数据构建、评测有深入理解,有相关项目经验
  • 良好的团队协作和沟通能力,能够独立带领任务并推动跨部门合作

申请策略

  • 关注字节跳动AI数据平台的相关文章和技术分享,了解其评测体系
  • 准备一个自己设计的Agent评测方案或数据构建案例作为作品集
  • 突出大模型或Agent相关项目中的数据构建、评测方案设计经验
  • 强调Python编程能力,尤其是Prompt Engineering、Function Call相关实践
  • 展示跨团队协作成果,如与算法/产品合作推动模型迭代的具体案例
  • 系统学习LangChain、AutoGPT等Agent框架,加深对Workflow理解
  • 补充大模型评测方法论,如基准测试、人类反馈、自动化评估等

面试指南

  • 用STAR法则(情境-任务-行动-结果)清晰描述项目经历
  • 结构化拆解问题:先定义指标,再设计数据采集和评估流程,最后迭代
  • 请描述你过去参与的一个大模型数据或评测项目,你承担了什么角色?
  • 如何设计一个针对Function Calling能力的评测方案?
  • 当模型效果不如预期时,你如何通过数据分析和迭代来改善?
  • 你如何与算法和产品团队协作,确保数据有效支撑模型迭代?
  • 复习大模型基础、Agent架构、RLHF等知识
  • 准备至少一个完整的数据评测项目案例,包括思路、方法、成果

匹配度报告

76
综合匹配度

字节跳动AI数据专家岗,前沿技术栈,高薪高压,成长快。

适合人群
适合追求技术成长和高薪酬,能接受高强度工作的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展92
工作生活50
使命价值75

薪资福利匹配

85较高

字节跳动薪资在互联网中处于顶尖水平,福利完善,年终奖丰厚,但JD未明确薪资,需面试确认。

薪资信号未披露(AI估算:40K-60K/月)

成长发展匹配

92较高

职位涉及前沿AI技术,成长空间大,字节跳动内部有丰富的学习和晋升资源,但JD未明确提及培训或晋升路径。

技术前沿前沿/新兴技术
技术栈Python、Prompt Engineering、Agent、Workflow、Function Call、大模型
业务类型profit_center

工作生活匹配

50较低

字节跳动工作强度较大,JD未提及WLB,北京办公且未明确弹性工作,生活平衡一般。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

75中等

AI行业高速发展,技术推动社会进步,但JD未明确社会价值导向,使命感一般。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 后端开发工程师-TikTok搜索

    字节跳动 · 上海市
    AI 估算 · 25k-45k
  • 网关运维SRE工程师

    字节跳动 · 北京市
    AI 估算 · 25k-40k
  • 人事产品应用实施顾问-飞书

    字节跳动 · 广州市
    AI 估算 · 25k-35k
  • 模型训练-CQC

    字节跳动 · 成都市
    AI 估算 · 25k-40k
  • 用户治理平台产品经理-TikTok安全产品

    字节跳动 · 北京市
    AI 估算 · 25k-40k

相似职位推荐

  • 高级数据分析师(B端产品方向)-【电商】

    快手 · 北京市
    AI 估算 · 25k-40k
  • 数据挖掘岗

    中国平安 · 深圳市
    AI 估算 · 15k-25k
  • 数据分析专家

    中国平安 · 深圳市
    AI 估算 · 30k-50k
  • 内容数据科学实习生

    小红书 · 上海市
    AI 估算 · 5k-8k
  • 高级数据分析师—影像(厦门)

    美图 · 厦门市
    AI 估算 · 25k-40k

字节跳动 的其他在招职位

  • 后端开发工程师-TikTok搜索

    字节跳动 · 上海市
    AI 估算 · 25k-45k
  • 网关运维SRE工程师

    字节跳动 · 北京市
    AI 估算 · 25k-40k
  • 人事产品应用实施顾问-飞书

    字节跳动 · 广州市
    AI 估算 · 25k-35k
  • 模型训练-CQC

    字节跳动 · 成都市
    AI 估算 · 25k-40k
  • 用户治理平台产品经理-TikTok安全产品

    字节跳动 · 北京市
    AI 估算 · 25k-40k

相似职位推荐

  • 高级数据分析师(B端产品方向)-【电商】

    快手 · 北京市
    AI 估算 · 25k-40k
  • 数据挖掘岗

    中国平安 · 深圳市
    AI 估算 · 15k-25k
  • 数据分析专家

    中国平安 · 深圳市
    AI 估算 · 30k-50k
  • 内容数据科学实习生

    小红书 · 上海市
    AI 估算 · 5k-8k
  • 高级数据分析师—影像(厦门)

    美图 · 厦门市
    AI 估算 · 25k-40k