百度的大模型评估策略PM（J98762）薪资是多少？

该职位薪资范围为 35k–60k（人民币/月）。

大模型评估策略PM（J98762）的工作地点在哪里？

该职位工作地点位于北京市。工作形式为仅现场办公。

该职位要求本科学历及中级经验工作经验。

🤖 AI 估测：¥35K-60K

发布时间：22 天前

该职位是百度的大模型评估策略产品经理，主要负责为大语言模型、视觉语言模型及智能体等多种AI模型，设计并构建一套完整的评估体系与自动化评测流程

你需要深入理解模型能力，设计可落地的评估指标，并开发工具来管理评测数据、执行自动化评测、分析结果，最终帮助研发和业务团队准确理解模型性能

负责大模型评估体系与评估 Pipeline 的设计、开发与持续演进，覆盖 LLM / VLM / Agent 等多种模型形态

深入理解模型能力结构（指令遵循、推理、代码、Agentic、多模态等），设计高区分度、可落地的评估指标与评测方法

构建并维护模型评估全流程能力，包括但不限于：

评测样本与数据集管理（版本化、标签体系、覆盖度）

自动化评测执行（批量推理、并发、失败重试、成本控制）

评估打分与聚合逻辑（规则 / LLM-judge / 多裁判）

结果可视化、模型横向对比、趋势分析与回归分析

与模型研发、产品、业务团队协作，帮助各方更准确、可解释地理解模型评估结果

本科及以上学历，计算机 / AI / NLP / 数据相关背景优先

对大模型体系有系统认知，理解不同模型能力与评估边界

具备较强的工程能力，能独立或主导：

评估 Pipeline 搭建（Python / 数据处理 / 推理调用 / 评测调度）

评估逻辑与工具开发（脚本化、服务化均可）

学习能力强，持续关注并吸收新模型、新范式、新评测方向

大模型评估策略PM（J98762）

🤖 AI 估测：¥35K-60K

发布时间：22 天前