Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

ByteDance logo
字节跳动
AI策略产品经理-Dev Infra
立即应聘

AI策略产品经理-Dev Infra

发布于 大约 14 小时前

普通员工/个人贡献者

杭州市
中级经验
全职员工
仅现场办公
本科
软件工程
产品经理
LLM
可观测性
数据生产
AI策略
Agent评测
效能度量

AI 估算 · 25k–45k

字节跳动大厂,AI方向热门,1-3年经验产品经理,薪资竞争力强,市场行情中上水平。

职位详情

关于这个职位

该职位负责字节跳动研发基础设施平台的AI Agent产品评测,涉及研发效能、质量、可观测性等方向

你将制定评测标准与数据集,开发数据采集方法,并建设评测平台,推动Agent效果的持续优化
适合对LLM/Agent有深入理解,兼具算法策略和产品思维的人才

最低要求

本科及以上学历,计算机科学、人工智能或相关专业优先

年以上的算法策略产品经理或算法工程师经验
对LLM/Agent效果评测及优化有深入的理解
对Agent和人类行为有浓厚的兴趣
充满了好奇心,愿意花费时间阅读最新的论文和技术报告
有较强的动手能力和新技术学习能力,能发现场景机会并动手实践

工作职责

负责字节跳动研发基础设施平台的Agent产品评测,方向涵盖研发效能、质量、可观测性等

根据各方向垂域Agent的业务特点与价值,制定合理的评测标准与评测集
开发对齐数据采集和生产的方法,确保数据质量保持在高标准,并根据定量和定性反馈不断改进,建立评测主导的效果演进
评估数据生产工具对数据生产的有效性和质量的影响
利用LLM本身,不断提高人工和合成数据的效率和效果上限
建设评测平台,为司内各垂域Agent/Skill提供具有普遍性、标杆性的评测体系

优先资格

了解DevOps、软件工程、可观测性、效能度量等相关领域知识者优先

AI 洞察

优缺点分析

优点

  • 字节跳动大厂光环,薪资福利优厚,技术氛围浓厚
  • AI Agent方向为行业前沿,个人技术壁垒和行业认可度提升快
  • 工作内容涉及研发基础设施,可深度理解字节内部技术栈,人脉资源丰富
  • 产品经理+算法交叉能力,职业路径宽广
  • 要求较强的技术背景和动手能力,纯产品经验可能不够,需快速补齐技术知识
  • 大厂节奏快,可能工作强度大,需适应弹性加班
  • 适合技术背景较强、对AI Agent评测有浓厚兴趣、喜欢动手实践的产品经理,或想转型产品的算法工程师

缺点 / 挑战

  • 评测工作较为细致,需要耐心和严谨,可能面临大量重复性数据工作

角色解读

  • 在字节跳动内部积累AI产品评测全链路经验,成为Agent评测领域的专家
  • 横向拓展至其他AI产品方向(如推荐、搜索、NLP等),或向更高级产品专家/管理岗发展
  • 借助大厂平台资源,跳槽至其他头部互联网公司或创业公司担任AI产品负责人
  • 制定AI Agent的评测标准和数据集,确保产品效果可量化
  • 开发数据采集与生产流程,利用LLM提升数据质量和效率
  • 建设统一的评测平台,为内部多个Agent产品提供标杆性评测体系
  • 与工程、算法团队紧密协作,推动Agent持续优化迭代
  • 扎实的产品经理基础,熟悉算法策略或评测体系设计
  • 对LLM/Agent有深入理解和实践经验,能阅读最新论文
  • 较强的动手能力,能快速验证想法并落地
  • 了解DevOps、软件工程、可观测性等基础设施领域知识

申请策略

  • 在面试中展示对Agent行为的好奇心和深入思考,例如提出独特的评测思路
  • 了解字节跳动内部Agent产品(如字节Coze、飞书智能助手等),在面试中体现主动性
  • 突出LLM/Agent相关的项目经验,包括评测方案、数据生产、效果优化等
  • 强调动手能力,如构建过评测数据集、使用Python进行数据处理的实例
  • 展示对DevOps或研发效能领域的理解,体现跨领域知识
  • 量化成果,如评测准确率提升、数据生产效率提升等
  • 补充LLM Agent评测相关论文和技术报告,了解SOTA方法
  • 学习Python数据处理和自动化脚本,提升动手能力

面试指南

  • STAR法则:阐述背景、任务、行动、结果,突出量化指标
  • 分层思考:从粗粒度到细粒度,如先明确评测维度(准确性、效率、稳定性),再定义具体指标
  • 结合案例:用实际项目展示逻辑,说明你如何平衡标注成本和质量
  • 如何定义AI Agent的评测标准?请举例说明
  • 如何设计一个评测数据集?需要考虑哪些因素?
  • LLM在数据生产和质量提升中的作用和局限是什么?
  • 描述一个你参与过的Agent评测项目,遇到的最大挑战是什么?
  • 你对DevOps和可观测性有多少了解?如何与评测结合?

匹配度报告

66
综合匹配度

字节大厂AI前沿岗,技术含金量高,但WLB较差。

适合人群
适合追求技术成长、不介意工作压力、重视薪资和职业发展的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展90
工作生活30
使命价值60

薪资福利匹配

85较高

字节跳动薪资在行业内具有较强竞争力,且福利完善,但JD未明确具体薪资和福利,综合判断补偿性动机满足度较高。

薪资信号未披露(AI估算:25K-45K/月)

成长发展匹配

90较高

该职位涉足AI Agent前沿方向,技术栈新颖,且公司大平台提供丰富的学习资源和晋升通道,发展性动机满足度高。

技术前沿前沿/新兴技术
技术栈LLM、Agent、DevOps、可观测性
业务类型profit_center

工作生活匹配

30较低

字节跳动通常要求现场办公,工作强度较大,WLB一般,生活化动机满足度较低。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

60中等

AI Agent评测工作有助于提升研发效能,具有技术价值,但直接社会影响力有限,意义感动机中等。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

字节跳动 的其他在招职位

  • 物流供应商管理专家-TikTok Shop

    字节跳动 · 珠海市
    AI 估算 · 25k-40k
  • 产品经理(广告信号方向)-国际商业化产品与技术(北京/上海)

    字节跳动 · 北京市
    AI 估算 · 25k-40k
  • 消息队列产品经理-Data

    字节跳动 · 杭州市
    AI 估算 · 30k-50k
  • 商家产品运营高级经理-抖音生活服务

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • CRM产品经理(AI方向)-抖音电商

    字节跳动 · 上海市
    AI 估算 · 30k-55k

相似职位推荐

  • 产品经理(治理方向)-【生活服务】

    快手 · 北京市
    AI 估算 · 20k-35k
  • AI产品实习生(agent方向)-【生活服务】

    快手 · 北京市
    AI 估算 · 4k-6k

字节跳动 的其他在招职位

  • 物流供应商管理专家-TikTok Shop

    字节跳动 · 珠海市
    AI 估算 · 25k-40k
  • 产品经理(广告信号方向)-国际商业化产品与技术(北京/上海)

    字节跳动 · 北京市
    AI 估算 · 25k-40k
  • 消息队列产品经理-Data

    字节跳动 · 杭州市
    AI 估算 · 30k-50k
  • 商家产品运营高级经理-抖音生活服务

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • CRM产品经理(AI方向)-抖音电商

    字节跳动 · 上海市
    AI 估算 · 30k-55k

相似职位推荐

  • 产品经理(治理方向)-【生活服务】

    快手 · 北京市
    AI 估算 · 20k-35k
  • AI产品实习生(agent方向)-【生活服务】

    快手 · 北京市
    AI 估算 · 4k-6k