美团的LongCat - 基座大模型评测分析研究员薪资是多少？

该职位薪资范围为 25k–45k（人民币/月）。

LongCat - 基座大模型评测分析研究员的工作地点在哪里？

该职位工作地点位于上海市。工作形式为仅现场办公。

美团的LongCat - 基座大模型评测分析研究员有什么任职要求？

该职位要求硕士学历及中级经验工作经验。

美团

LongCat - 基座大模型评测分析研究员

立即应聘

LongCat - 基座大模型评测分析研究员

发布于大约 2 个月前

普通员工/个人贡献者

上海市

中级经验

全职员工

仅现场办公

硕士

研究与开发 (研发)

Scaling Law

大模型

数据分析

数据配比

模型评测

深度学习

算法研究

自然语言处理

RLHF

AI 估算 · 25k–45k

大模型方向热门，硕士学历，一线大厂，薪资竞争力强，参考市场水平。

职位详情

关于这个职位

作为一名基座大模型评测分析研究员，你将深入参与大语言模型的评测与研究，通过数据分析与实验设计，定位模型问题并探索优化方案

你将与顶尖AI团队合作，追踪前沿技术，推动大模型在预训练、SFT、RLHF等阶段的持续迭代

这个职位适合热爱技术、有算法功底且希望在大模型领域深耕的求职者

最低要求

硕士及以上学历，计算机、数学、统计学或相关专业

熟悉Java/Python/C++等编程语言，良好的编码习惯和一定的工程能力，对每一行代码负责，具备工匠精神

具有较强的算法研究经验与能力，熟练掌握自然语言处理、多模态或大模型相关算法和模型

具备良好的综合素质，包括沟通能力、团队合作精神以及较强的应对复杂问题的解决能力

工作职责

深入理解大规模语言模型的模型结构、训练过程以及评测方式，根据模型的训练过程以及评测结果，对大语言模型存在的问题进行研究

深入分析模型效果不符合认知的异常，根据具体的异常制定完善的研究策略，通过对比、归纳等方法，产出研究分析结论，探索突破性的优化方案，带来模型效果的迭代和突破

构建Data-Centric的数据-训练-评测闭环，探索研究包括但不限于下列方向：大模型数据、模型的Scaling Law，研究数据配比、加入方式与时机等对模型效果的影响

追踪大模型方向的前沿进展，积极主动地学习和探索新数据分析、模型训练以及模型评测方法

与各相关部门保持良好沟通，深度参与大模型预训练、SFT、RLHF和评测等阶段，共同推动大模型持续优化

AI 洞察

优缺点分析

优点

参与前沿大模型研发，接触最先进的技术和超大算力集群，技术成长快
美团基础研发平台资源丰富，有完善的学习生态圈和业界交流机会
岗位定位核心，直接影响模型效果，成就感强，且属于AI热门赛道
要求深厚的算法基础和持续学习能力，技术更新快，需要不断跟进论文和开源成果
适合热爱技术、喜欢钻研、有较强算法功底和自驱力的求职者，尤其是对大模型评测和优化有浓厚兴趣的人

缺点 / 挑战

工作强度可能较高，大模型训练周期长，需应对突发问题和迭代压力
跨部门协作多，需要平衡各方需求，沟通成本较高

角色解读

专业路径：从研究员成长为技术专家，专注大模型评测与优化，掌握Scaling Law等核心规律
管理路径：积累经验后带领团队负责模型评测方向，或横向扩展至模型训练全链路
行业机会：大模型是AI领域风口，具备此经验可跳槽至头部科技公司或创业团队
分析大语言模型的评测结果，定位模型在训练和推理中的问题，并提出改进方向
构建数据-训练-评测闭环，研究数据配比、Scaling Law对模型效果的影响
追踪前沿技术，探索新的评测方法和优化策略，并推动团队技术迭代
与算法、工程团队紧密协作，参与预训练、SFT、RLHF等全流程优化
扎实的编程能力，精通Java/Python/C++，能够高效实现算法和数据处理流程
深入理解NLP、多模态或大模型相关算法，熟悉Transformer、BERT、GPT等架构
具备数据分析和实验设计能力，能从海量数据中提炼规律并指导模型优化
良好的沟通与协作能力，能在跨团队项目中推动技术落地

申请策略

深入了解美团在零售+科技领域的大模型应用场景，在面试中展示业务思维
准备1-2个你曾经解决的模型优化案例，详细描述问题分析、实验设计和结论
突出大模型相关项目经验，如参与过预训练、微调或评测工作，量化成果（如提升指标）
强调编程能力和算法功底，列出熟悉的框架（PyTorch/TensorFlow）和语言（Python/C++）
展示数据分析和实验设计能力，如设计过对比实验或分析过模型异常案例
如有论文或开源贡献，务必列出，体现研究深度
系统学习大模型技术栈：Transformer原理、RLHF、Prompt Engineering、模型压缩等
实践数据分析和可视化工具，如Pandas、Matplotlib、TensorBoard，用于分析模型行为

面试指南

对于项目描述类问题，采用STAR法则（情境-任务-行动-结果），突出个人贡献和量化成果
对于技术原理类问题，先解释核心概念，再结合实际案例说明应用场景和局限性
对于问题解决类问题，结构化思考：假设-验证-迭代，强调数据驱动和实验方法论
请详细描述你参与过的一个大模型项目，包括模型架构、训练流程和评测指标
如何评估大语言模型的性能？请列举你熟悉的评测指标和方法，并说明各自的优缺点
模型在评测中表现不佳，你如何定位问题？请描述你的分析思路和步骤
什么是Scaling Law？如何设计实验验证数据量与模型效果的关系？
在多轮对话场景中，如何设计自动化评测方法以确保模型回复质量？

职位点评

综合评分

美团大模型研究员，前沿技术栈、发展空间大，但工作强度可能较高。

更适合这类人

最适合追求技术成长和职业发展的求职者，对工作生活平衡要求不高。

表现最好

成长发展

相对薄弱

工作生活

薪资福利85

成长发展95

工作生活50

使命价值70

薪资福利

85较高

美团作为上市大厂，薪资福利有竞争力，但JD未明确具体薪酬，市场水准偏高，年终奖和股票一般。

薪资信号未披露（AI估算：25K-45K/月）

成长发展

95较高

岗位涉及大模型全流程，技术前沿，成长空间大，JD提到'快速成长'、'一流团队'、'学习生态圈'，发展动机高度满足。

技术前沿前沿/新兴技术

技术栈大模型、自然语言处理、深度学习、Scaling Law、RLHF

成长机会快速成长、学习生态圈、非线性成长、一流团队

业务类型ambiguous

工作生活

50较低

工作地点上海，仅现场办公，未提弹性，互联网大厂通常工作强度较大，WLB一般。

工作模式仅现场办公

办公地点市区核心地段

加班情况未提及（无法判断）

使命价值

70中等

大模型属于高速增长赛道，技术进步能推动行业，但美团核心业务偏零售，社会影响力中性。

行业发展高速增长赛道

社会影响中性/一般

创新程度积极采用新技术

Watch Jobs

美团

LongCat - 基座大模型评测分析研究员

立即应聘

LongCat - 基座大模型评测分析研究员

发布于大约 2 个月前

普通员工/个人贡献者

上海市

中级经验

全职员工

仅现场办公

硕士

研究与开发 (研发)

Scaling Law

大模型

数据分析

数据配比

模型评测

深度学习

算法研究

自然语言处理

RLHF

AI 估算 · 25k–45k

大模型方向热门，硕士学历，一线大厂，薪资竞争力强，参考市场水平。

职位详情

关于这个职位

作为一名基座大模型评测分析研究员，你将深入参与大语言模型的评测与研究，通过数据分析与实验设计，定位模型问题并探索优化方案

你将与顶尖AI团队合作，追踪前沿技术，推动大模型在预训练、SFT、RLHF等阶段的持续迭代

这个职位适合热爱技术、有算法功底且希望在大模型领域深耕的求职者

最低要求

硕士及以上学历，计算机、数学、统计学或相关专业

熟悉Java/Python/C++等编程语言，良好的编码习惯和一定的工程能力，对每一行代码负责，具备工匠精神

具有较强的算法研究经验与能力，熟练掌握自然语言处理、多模态或大模型相关算法和模型

具备良好的综合素质，包括沟通能力、团队合作精神以及较强的应对复杂问题的解决能力

工作职责

深入理解大规模语言模型的模型结构、训练过程以及评测方式，根据模型的训练过程以及评测结果，对大语言模型存在的问题进行研究

追踪大模型方向的前沿进展，积极主动地学习和探索新数据分析、模型训练以及模型评测方法

与各相关部门保持良好沟通，深度参与大模型预训练、SFT、RLHF和评测等阶段，共同推动大模型持续优化

AI 洞察

优缺点分析

优点

参与前沿大模型研发，接触最先进的技术和超大算力集群，技术成长快
美团基础研发平台资源丰富，有完善的学习生态圈和业界交流机会
岗位定位核心，直接影响模型效果，成就感强，且属于AI热门赛道
要求深厚的算法基础和持续学习能力，技术更新快，需要不断跟进论文和开源成果
适合热爱技术、喜欢钻研、有较强算法功底和自驱力的求职者，尤其是对大模型评测和优化有浓厚兴趣的人

缺点 / 挑战

工作强度可能较高，大模型训练周期长，需应对突发问题和迭代压力
跨部门协作多，需要平衡各方需求，沟通成本较高

角色解读

专业路径：从研究员成长为技术专家，专注大模型评测与优化，掌握Scaling Law等核心规律
管理路径：积累经验后带领团队负责模型评测方向，或横向扩展至模型训练全链路
行业机会：大模型是AI领域风口，具备此经验可跳槽至头部科技公司或创业团队
分析大语言模型的评测结果，定位模型在训练和推理中的问题，并提出改进方向
构建数据-训练-评测闭环，研究数据配比、Scaling Law对模型效果的影响
追踪前沿技术，探索新的评测方法和优化策略，并推动团队技术迭代
与算法、工程团队紧密协作，参与预训练、SFT、RLHF等全流程优化
扎实的编程能力，精通Java/Python/C++，能够高效实现算法和数据处理流程
深入理解NLP、多模态或大模型相关算法，熟悉Transformer、BERT、GPT等架构
具备数据分析和实验设计能力，能从海量数据中提炼规律并指导模型优化
良好的沟通与协作能力，能在跨团队项目中推动技术落地

申请策略

深入了解美团在零售+科技领域的大模型应用场景，在面试中展示业务思维
准备1-2个你曾经解决的模型优化案例，详细描述问题分析、实验设计和结论
突出大模型相关项目经验，如参与过预训练、微调或评测工作，量化成果（如提升指标）
强调编程能力和算法功底，列出熟悉的框架（PyTorch/TensorFlow）和语言（Python/C++）
展示数据分析和实验设计能力，如设计过对比实验或分析过模型异常案例
如有论文或开源贡献，务必列出，体现研究深度
系统学习大模型技术栈：Transformer原理、RLHF、Prompt Engineering、模型压缩等
实践数据分析和可视化工具，如Pandas、Matplotlib、TensorBoard，用于分析模型行为

面试指南

对于项目描述类问题，采用STAR法则（情境-任务-行动-结果），突出个人贡献和量化成果
对于技术原理类问题，先解释核心概念，再结合实际案例说明应用场景和局限性
对于问题解决类问题，结构化思考：假设-验证-迭代，强调数据驱动和实验方法论
请详细描述你参与过的一个大模型项目，包括模型架构、训练流程和评测指标
如何评估大语言模型的性能？请列举你熟悉的评测指标和方法，并说明各自的优缺点
模型在评测中表现不佳，你如何定位问题？请描述你的分析思路和步骤
什么是Scaling Law？如何设计实验验证数据量与模型效果的关系？
在多轮对话场景中，如何设计自动化评测方法以确保模型回复质量？

职位点评

综合评分

美团大模型研究员，前沿技术栈、发展空间大，但工作强度可能较高。

更适合这类人

最适合追求技术成长和职业发展的求职者，对工作生活平衡要求不高。

表现最好

成长发展

相对薄弱

工作生活

薪资福利85

成长发展95

工作生活50

使命价值70

薪资福利

85较高

美团作为上市大厂，薪资福利有竞争力，但JD未明确具体薪酬，市场水准偏高，年终奖和股票一般。

薪资信号未披露（AI估算：25K-45K/月）

成长发展

95较高

岗位涉及大模型全流程，技术前沿，成长空间大，JD提到'快速成长'、'一流团队'、'学习生态圈'，发展动机高度满足。

技术前沿前沿/新兴技术

技术栈大模型、自然语言处理、深度学习、Scaling Law、RLHF

成长机会快速成长、学习生态圈、非线性成长、一流团队

业务类型ambiguous

工作生活

50较低

工作地点上海，仅现场办公，未提弹性，互联网大厂通常工作强度较大，WLB一般。

工作模式仅现场办公

办公地点市区核心地段

加班情况未提及（无法判断）

使命价值

70中等

大模型属于高速增长赛道，技术进步能推动行业，但美团核心业务偏零售，社会影响力中性。

行业发展高速增长赛道

社会影响中性/一般

创新程度积极采用新技术

Watch Jobs

LongCat - 基座大模型评测分析研究员

职位详情

关于这个职位

最低要求

工作职责

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

LongCat - 基座大模型评测分析研究员

职位详情

关于这个职位

最低要求

工作职责

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

美团 的其他在招职位

充电宝CKA销售（福州）

Keeta沙特业务运营实习生（Business Operations Intern）

项目经理

美团骑行-政企大客户专家（浙江）

小象线上店店长-绵阳

相似职位推荐

Lamination & Gluing Engineer - Process

Coordinator Engineering Electric

Industrial Engineering ES

Plastic welding Engineer - Process

飞控平台系统工程师

美团 的其他在招职位

充电宝CKA销售（福州）

Keeta沙特业务运营实习生（Business Operations Intern）

项目经理

美团骑行-政企大客户专家（浙江）

小象线上店店长-绵阳

相似职位推荐

Lamination & Gluing Engineer - Process

Coordinator Engineering Electric

Industrial Engineering ES

Plastic welding Engineer - Process

飞控平台系统工程师

美团的其他在招职位

美团的其他在招职位