Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Meituan logo
美团
小团-评测一线 AI Builder
立即应聘

小团-评测一线 AI Builder

发布于 5 天前

普通员工/个人贡献者

北京市
中级经验
全职员工
仅现场办公
学历未注明
数据分析与科学
NLP
数据分析
SQL
LLM
搜索推荐
Prompt调优
Ai评测
Badcase分析

AI 估算 · 20k–35k

北京大厂技术岗,1-3年经验,AI评测方向薪资有竞争力,中位数约2.7万/月,15薪。

职位详情

关于这个职位

这个职位主要负责AI模型的效果评测工作,包括执行评测任务、分析badcase、维护数据集等

你将直面大模型(LLM/Agent)的真实输出,从数据中发现问题并推动改进,是连接技术与产品质量的关键角色
适合对AI有浓厚兴趣、善于数据分析的同学

最低要求

)1-3年数据分析、产品、或测试相关经验 2)具备较强的数据敏感度和逻辑分析能力,能使用ai+sql/Python完成常见的数据处理工作 3)有搜推/NLP/AI 相关评测、效果分析经验优先

工作职责

)执行日常AI效果评测任务--按 pipeline 标准流程产出评测报告和结论

)Badcase 深度分析与归因-- 定位问题根因(prompt/model/data/tool 各环节),推动修复闭环 3)评测数据集维护与优化--持续迭代评测 case 库,确保覆盖度和有效性 4)配合评测负责人完善 pipeline--参与评测工具链建设和标准化流程迭代 5)评测报告产出与沟通-- 将评测结论清晰传达给产品/研发,推动落地改进

优先资格

有搜推/NLP/AI 相关评测、效果分析经验优先

AI 洞察

优缺点分析

优点

  • 直接接触前沿AI技术(LLM/Agent),比多数岗位更早感知技术演进方向,知识积累快
  • 参与评测体系从0到1搭建,有机会定义质量标准和影响力,成就感强
  • 结论直达决策层,推动链路短,反馈快,工作价值显性化
  • 作为中间角色,需平衡技术准确性和业务目标,沟通协调要求高
  • 适合对AI质量有热情、善于从数据中发现问题并推动改进的同学
  • 喜欢动手分析、愿意深入技术细节,同时希望影响产品方向的人会很适合

缺点 / 挑战

  • 工作涉及数据分析、Prompt调优、工具建设等复合内容,避免单一重复,成长空间大
  • 日常执行评测任务可能较繁琐,需要耐心和细致,对重复性工作要有心理准备
  • 需要快速学习新模型和工具,持续跟进AI领域更新,技术迭代压力大

角色解读

  • 从评测助理成长为评测专家,深入理解AI模型能力边界,成为质量保障核心角色
  • 转向AI产品经理或AI研发岗,凭借对模型效果的一手认知,主导产品优化或模型训练
  • 可发展为数据科学家或AI解决方案架构师,利用评测经验做更上游的决策
  • 执行AI模型的日常效果评测,按照标准流程产出评测报告,确保模型输出质量
  • 深入分析badcase,定位问题根因(prompt、模型、数据、工具等),并推动修复闭环
  • 维护和优化评测数据集,持续迭代case库以提高覆盖度和有效性,参与评测工具链建设
  • 将评测结论清晰传达给产品和研发团队,推动实际改进落地
  • 具备数据分析能力,能使用SQL和Python进行数据处理和分析
  • 对AI/LLM/Agent有一定了解,有搜索推荐或NLP评测经验更佳
  • 逻辑思维强,能系统性地归因问题并给出改进建议
  • 良好的沟通能力,能将技术结论转化为业务语言

申请策略

  • 在简历中附上你曾经做过的评测报告或数据分析作品集(脱敏后),展示你的输出能力
  • 面试前了解美团的业务场景(外卖、到店、搜索等),思考AI评测如何服务于具体业务
  • 突出数据分析项目经历,特别是涉及模型效果评估或用户行为分析的案例,展示SQL/Python能力
  • 如果有AI相关项目(如使用过LLM、做过搜索推荐评测),重点描述你在其中的角色和成果
  • 强调逻辑分析和问题归因能力,例如如何从badcase找到根因并推动解决
  • 体现沟通和协作能力,如跨团队推进改进的经验
  • 强化SQL和Python数据处理技能,尤其是pandas、数据可视化等常用库
  • 学习Prompt调优和LLM评测方法论,了解RLHF、自动化评测等概念

面试指南

  • STAR方法:情境(Situation)-任务(Task)-行动(Action)-结果(Result),用于描述具体案例
  • 分维度分析:对LLM评测可从准确性、安全性、相关性、多样性等多维度展开
  • 归因逻辑:从问题表象出发,逐步排除变量(prompt变化、模型版本、数据分布等),定位根因
  • 请描述一次你通过数据分析发现并解决某个问题的经历
  • 如何设计一个针对LLM生成效果的评测用例?你会关注哪些维度?
  • 假设一个badcase,模型回答不准确,如何排查是prompt、模型还是数据的问题?
  • 你用过哪些AI工具或模型?如何评估它们的效果?
  • 面对大量评测数据,你会如何高效总结出有价值结论?

匹配度报告

72
综合匹配度

大厂AI评测岗,前沿技术栈,复合成长路径,薪资有竞争力但WLB一般。

适合人群
更适合追求技术成长、愿意在AI领域深耕的求职者,对工作生活平衡要求不高。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利75
成长发展85
工作生活60
使命价值70

薪资福利匹配

75中等

美团作为上市大厂,薪资福利在行业内具备竞争力,但JD未明确具体薪资和福利,需面试确认。整体能满足补偿性动机。

薪资信号未披露(AI估算:20K-35K/月)

成长发展匹配

85较高

职位直接接触前沿AI技术,参与体系搭建,复合技能成长路径清晰,发展性动机得到较好满足。

技术前沿前沿/新兴技术
技术栈LLM、Agent、Python、SQL、NLP、搜索推荐
成长机会从0到1搭建、复合能力
业务类型ambiguous

工作生活匹配

60中等

北京现场办公,未提及弹性工作或WLB,通勤压力较大,生活化动机满足程度一般。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值匹配

70中等

AI行业高速增长,工作对提升AI质量有直接贡献,但日常评测的社会影响力有限,意义感中等。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

美团 的其他在招职位

  • 运输调度主管

    美团 · 广州市
    AI 估算 · 10k-18k
  • 数据产品经理

    美团 · 北京市
    AI 估算 · 30k-50k
  • 白班运营主管

    美团 · 重庆市
    AI 估算 · 8k-12k
  • AI Builder-供给理解

    美团 · 北京市
    AI 估算 · 30k-50k
  • Litigation Legal Counsel, Saudi Arabia

    美团 · 利雅得
    AI 估算 · 20k-35k

相似职位推荐

  • 商业分析师-战略规划

    希音 · 上海市
    AI 估算 · 25k-40k
  • (童装)资深数据分析师(组长)

    希音 · 广州市
    AI 估算 · 20k-35k
  • GTMC-Analytical Manager-Shanghai

    赛诺菲 · 上海市
    AI 估算 · 25k-40k
  • 数据分析实习生(社区)

    网易 · 杭州市
    AI 估算 · 4k-6k
  • Business Intelligence Analyst_PT

    博世 · 杭州市
    AI 估算 · 15k-25k

美团 的其他在招职位

  • 运输调度主管

    美团 · 广州市
    AI 估算 · 10k-18k
  • 数据产品经理

    美团 · 北京市
    AI 估算 · 30k-50k
  • 白班运营主管

    美团 · 重庆市
    AI 估算 · 8k-12k
  • AI Builder-供给理解

    美团 · 北京市
    AI 估算 · 30k-50k
  • Litigation Legal Counsel, Saudi Arabia

    美团 · 利雅得
    AI 估算 · 20k-35k

相似职位推荐

  • 商业分析师-战略规划

    希音 · 上海市
    AI 估算 · 25k-40k
  • (童装)资深数据分析师(组长)

    希音 · 广州市
    AI 估算 · 20k-35k
  • GTMC-Analytical Manager-Shanghai

    赛诺菲 · 上海市
    AI 估算 · 25k-40k
  • 数据分析实习生(社区)

    网易 · 杭州市
    AI 估算 · 4k-6k
  • Business Intelligence Analyst_PT

    博世 · 杭州市
    AI 估算 · 15k-25k