Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Meituan logo
美团
LongCat - 基座大模型评测分析研究员
立即应聘

LongCat - 基座大模型评测分析研究员

发布于 大约 14 小时前

普通员工/个人贡献者

上海市
中级经验
全职员工
仅现场办公
硕士
深度学习
数据分析
自然语言处理
算法研究
大模型
RLHF
模型评测
Scaling Law
数据配比

AI 估算 · 25k–45k

大模型方向热门,硕士学历,一线大厂,薪资竞争力强,参考市场水平。

职位详情

关于这个职位

作为一名基座大模型评测分析研究员,你将深入参与大语言模型的评测与研究,通过数据分析与实验设计,定位模型问题并探索优化方案

你将与顶尖AI团队合作,追踪前沿技术,推动大模型在预训练、SFT、RLHF等阶段的持续迭代
这个职位适合热爱技术、有算法功底且希望在大模型领域深耕的求职者

最低要求

硕士及以上学历,计算机、数学、统计学或相关专业

熟悉Java/Python/C++等编程语言,良好的编码习惯和一定的工程能力,对每一行代码负责,具备工匠精神
具有较强的算法研究经验与能力,熟练掌握自然语言处理、多模态或大模型相关算法和模型
具备良好的综合素质,包括沟通能力、团队合作精神以及较强的应对复杂问题的解决能力

工作职责

深入理解大规模语言模型的模型结构、训练过程以及评测方式,根据模型的训练过程以及评测结果,对大语言模型存在的问题进行研究

深入分析模型效果不符合认知的异常,根据具体的异常制定完善的研究策略,通过对比、归纳等方法,产出研究分析结论,探索突破性的优化方案,带来模型效果的迭代和突破
构建Data-Centric的数据-训练-评测闭环,探索研究包括但不限于下列方向:大模型数据、模型的Scaling Law,研究数据配比、加入方式与时机等对模型效果的影响
追踪大模型方向的前沿进展,积极主动地学习和探索新数据分析、模型训练以及模型评测方法
与各相关部门保持良好沟通,深度参与大模型预训练、SFT、RLHF和评测等阶段,共同推动大模型持续优化

AI 洞察

优缺点分析

优点

  • 参与前沿大模型研发,接触最先进的技术和超大算力集群,技术成长快
  • 美团基础研发平台资源丰富,有完善的学习生态圈和业界交流机会
  • 岗位定位核心,直接影响模型效果,成就感强,且属于AI热门赛道
  • 要求深厚的算法基础和持续学习能力,技术更新快,需要不断跟进论文和开源成果
  • 适合热爱技术、喜欢钻研、有较强算法功底和自驱力的求职者,尤其是对大模型评测和优化有浓厚兴趣的人

缺点 / 挑战

  • 工作强度可能较高,大模型训练周期长,需应对突发问题和迭代压力
  • 跨部门协作多,需要平衡各方需求,沟通成本较高

角色解读

  • 专业路径:从研究员成长为技术专家,专注大模型评测与优化,掌握Scaling Law等核心规律
  • 管理路径:积累经验后带领团队负责模型评测方向,或横向扩展至模型训练全链路
  • 行业机会:大模型是AI领域风口,具备此经验可跳槽至头部科技公司或创业团队
  • 分析大语言模型的评测结果,定位模型在训练和推理中的问题,并提出改进方向
  • 构建数据-训练-评测闭环,研究数据配比、Scaling Law对模型效果的影响
  • 追踪前沿技术,探索新的评测方法和优化策略,并推动团队技术迭代
  • 与算法、工程团队紧密协作,参与预训练、SFT、RLHF等全流程优化
  • 扎实的编程能力,精通Java/Python/C++,能够高效实现算法和数据处理流程
  • 深入理解NLP、多模态或大模型相关算法,熟悉Transformer、BERT、GPT等架构
  • 具备数据分析和实验设计能力,能从海量数据中提炼规律并指导模型优化
  • 良好的沟通与协作能力,能在跨团队项目中推动技术落地

申请策略

  • 深入了解美团在零售+科技领域的大模型应用场景,在面试中展示业务思维
  • 准备1-2个你曾经解决的模型优化案例,详细描述问题分析、实验设计和结论
  • 突出大模型相关项目经验,如参与过预训练、微调或评测工作,量化成果(如提升指标)
  • 强调编程能力和算法功底,列出熟悉的框架(PyTorch/TensorFlow)和语言(Python/C++)
  • 展示数据分析和实验设计能力,如设计过对比实验或分析过模型异常案例
  • 如有论文或开源贡献,务必列出,体现研究深度
  • 系统学习大模型技术栈:Transformer原理、RLHF、Prompt Engineering、模型压缩等
  • 实践数据分析和可视化工具,如Pandas、Matplotlib、TensorBoard,用于分析模型行为

面试指南

  • 对于项目描述类问题,采用STAR法则(情境-任务-行动-结果),突出个人贡献和量化成果
  • 对于技术原理类问题,先解释核心概念,再结合实际案例说明应用场景和局限性
  • 对于问题解决类问题,结构化思考:假设-验证-迭代,强调数据驱动和实验方法论
  • 请详细描述你参与过的一个大模型项目,包括模型架构、训练流程和评测指标
  • 如何评估大语言模型的性能?请列举你熟悉的评测指标和方法,并说明各自的优缺点
  • 模型在评测中表现不佳,你如何定位问题?请描述你的分析思路和步骤
  • 什么是Scaling Law?如何设计实验验证数据量与模型效果的关系?
  • 在多轮对话场景中,如何设计自动化评测方法以确保模型回复质量?

匹配度报告

75
综合匹配度

美团大模型研究员,前沿技术栈、发展空间大,但工作强度可能较高。

适合人群
最适合追求技术成长和职业发展的求职者,对工作生活平衡要求不高。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展95
工作生活50
使命价值70

薪资福利匹配

85较高

美团作为上市大厂,薪资福利有竞争力,但JD未明确具体薪酬,市场水准偏高,年终奖和股票一般。

薪资信号未披露(AI估算:25K-45K/月)

成长发展匹配

95较高

岗位涉及大模型全流程,技术前沿,成长空间大,JD提到'快速成长'、'一流团队'、'学习生态圈',发展动机高度满足。

技术前沿前沿/新兴技术
技术栈大模型、自然语言处理、深度学习、Scaling Law、RLHF
成长机会快速成长、学习生态圈、非线性成长、一流团队
业务类型ambiguous

工作生活匹配

50较低

工作地点上海,仅现场办公,未提弹性,互联网大厂通常工作强度较大,WLB一般。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

70中等

大模型属于高速增长赛道,技术进步能推动行业,但美团核心业务偏零售,社会影响力中性。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

美团 的其他在招职位

  • 政府投诉调解(驻所A)

    美团 · 北京市
    AI 估算 · 8k-15k
  • 商家端产品运营

    美团 · 北京市
    AI 估算 · 18k-30k
  • 用户体验调研运营(NPS方向)

    美团 · 北京市
    AI 估算 · 18k-28k
  • 充电宝-下沉战区-销售BD(渤海区域-保定、廊坊、烟台、威海、张家口、吉林、邯郸、潍坊、东营、太原)

    美团 · 保定市
    AI 估算 · 6k-15k
  • 视频拍摄及制作项目实习(客户案例&产品方向)

    美团 · 北京市
    AI 估算 · 4k-7k

相似职位推荐

  • 大模型评测算法工程师-AI数据与安全

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 大模型评测算法工程师-AI数据与安全

    字节跳动 · 深圳市
    AI 估算 · 25k-45k
  • 智能系统评估研究科学家-Commercial AI

    字节跳动 · 北京市
    AI 估算 · 35k-65k
  • 视觉感知算法工程师-PICO

    字节跳动 · 北京市
    AI 估算 · 30k-45k
  • 番茄模型运维(模型开发方向)运营-CQC

    字节跳动 · 北京市
    AI 估算 · 30k-50k

美团 的其他在招职位

  • 政府投诉调解(驻所A)

    美团 · 北京市
    AI 估算 · 8k-15k
  • 商家端产品运营

    美团 · 北京市
    AI 估算 · 18k-30k
  • 用户体验调研运营(NPS方向)

    美团 · 北京市
    AI 估算 · 18k-28k
  • 充电宝-下沉战区-销售BD(渤海区域-保定、廊坊、烟台、威海、张家口、吉林、邯郸、潍坊、东营、太原)

    美团 · 保定市
    AI 估算 · 6k-15k
  • 视频拍摄及制作项目实习(客户案例&产品方向)

    美团 · 北京市
    AI 估算 · 4k-7k

相似职位推荐

  • 大模型评测算法工程师-AI数据与安全

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 大模型评测算法工程师-AI数据与安全

    字节跳动 · 深圳市
    AI 估算 · 25k-45k
  • 智能系统评估研究科学家-Commercial AI

    字节跳动 · 北京市
    AI 估算 · 35k-65k
  • 视觉感知算法工程师-PICO

    字节跳动 · 北京市
    AI 估算 · 30k-45k
  • 番茄模型运维(模型开发方向)运营-CQC

    字节跳动 · 北京市
    AI 估算 · 30k-50k