Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/月之暗面/Agent模型评估产品经理
Moonshot AI logo
M
月之暗面 (Moonshot AI)

职位信息

北京市
中级经验
全职员工
仅现场办公
本科
普通员工/个人贡献者

标签

产品指标多模态模型大语言模型结构化分析Benchmark设计Agent评估模型行为分析自动化Evals
💡

核心评价

AI前沿领域的产品岗,技术成长性极佳,薪资预期良好,但工作节奏快且WLB信号不明。

Agent模型评估产品经理

🤖 AI 估测:¥35K-60K

发布时间:5 天前

立即应聘

ℹ️关于这个职位

该职位是Agent模型评估产品经理,核心工作是构建和迭代大模型(尤其是Agent)在真实应用场景下的行为与质量评估体系
你需要负责设计自动化评估方法、识别模型缺陷、并推动跨团队协作,将评估结论转化为模型迭代的优化方向,确保产品在用户价值、可靠性、安全性等维度上的持续提升

✓工作职责

负责构建大模型在真实应用场景下的行为与质量评估体系,涵盖用户价值、可靠性、多模态表现、安全性等维度
能够从用户反馈、模型行为观察、研究侧目标中提炼评估方向,并形成评估结论推动模型迭代
持续迭代评估方法,包括但不限于:可扩展的自动化 Evals、Benchmark任务设计、评估工具链与流程优化
确保评估体系能覆盖新能力、Badcase及模型升级版本
与研究、工程、数据科学等团队紧密协作,基于线上观测、实验结果和用户访谈,识别模型缺陷与改进机会,并给出可执行的优化方向与验证方案
负责推动跨团队闭环,统筹评估目标、资源优先级与落地节奏,确保关键模型行为、风险点、用户体验问题能够被快速验证、追踪与优化

⭐最低要求

本科及以上学历,具备 3 年以上模型策略/评估相关产品经验
熟悉大语言模型、多模态模型或Agent评估者优先
具备强结构化分析能力,能够从复杂的模型行为中提炼本质问题,并将研究目标、用户需求与产品指标连接起来
对数据和指标体系敏感,能基于实验、日志、线上表现快速定位模型问题,并熟练制定合理的验证方案与评测集
对 AI 技术发展、模型训练原理、模型行为对齐、安全机制、Agent 体系有兴趣或基础理解,愿意阅读最新研究论文、model card、技术报告,并将其转化为评估与产品改进思路
具备强自驱力和结果导向,能在多团队协作、节奏快且信息不足的环境下推进项目
英语可作为工作语言者加分

👍优先资格

熟悉大语言模型、多模态模型或Agent评估者优先
英语可作为工作语言者加分
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

月之暗面 的其他在招职位

  • 资深系统开发工程师

    月之暗面

    北京市 · 仅现场办公

  • Infra 系统工程师 - 训练平台

    月之暗面

    北京市 · 仅现场办公

  • 资深后端工程师-商业化

    月之暗面

    北京市 · 仅现场办公

  • Agent Engineer / Agent 工程师

    月之暗面

    北京市 · 仅现场办公

  • API解决方案架构师

    月之暗面

    上海市 · 仅现场办公

相似职位推荐

  • 支付产品经理

    中国平安

    上海市 · 仅现场办公

  • 营销活动经理

    中国平安

    深圳市 · 仅现场办公

  • 产品经理

    中国平安

    青岛市 · 仅现场办公

  • 票据产品岗

    中国平安

    上海市 · 仅现场办公

  • 产品经理

    中国平安

    深圳市 · 仅现场办公