美团的【LongCat大模型人才校招】大模型算法研究员-Search Agent方向薪资是多少？

该职位薪资范围为 25k–40k（人民币/月）。

【LongCat大模型人才校招】大模型算法研究员-Search Agent方向的工作地点在哪里？

该职位工作地点位于北京市。工作形式为仅现场办公。

美团的【LongCat大模型人才校招】大模型算法研究员-Search Agent方向有什么任职要求？

该职位要求硕士学历及初级经验工作经验。

美团

【LongCat大模型人才校招】大模型算法研究员-Search Agent方向

立即应聘

【LongCat大模型人才校招】大模型算法研究员-Search Agent方向

发布于大约 2 个月前

普通员工/个人贡献者

北京市

初级经验

全职员工

仅现场办公

硕士

研究与开发 (研发)

多模态

大语言模型

强化学习

ICLR

ICML

NeurIPS

PyTorch

Search Agent

AI 估算 · 25k–40k

校招顶尖博士/硕士，大模型方向火热，美团薪资有竞争力，参考一线互联网算法岗

职位详情

关于这个职位

美团LongCat团队正在招聘大模型算法研究员，专注于Search Agent方向

你将参与下一代智能体的范式探索，研究Agentic RL、搜索智能体与生活服务助理Agent，在亿级真实用户场景中实现算法落地

适合对强化学习、大语言模型和Agent有浓厚兴趣、希望发表顶会论文的顶尖人才

最低要求

全球 Top 高校计算机科学、人工智能、数学或相关领域博士或硕士

在 NeurIPS、ICML、ICLR、ACL、EMNLP等大模型领域顶级会议以第一作者发表过论文，研究方向与大语言模型、强化学习、Agent、多模态模型等强相关

在大语言模型、强化学习、Agent、多模态等方向中至少一个领域有扎实的理论基础与实践经验，能独立完成从问题定义、方法设计、系统开发、实验验证的完整工作闭环，并深度使用AI工具辅助完成

扎实的代码功底，能高效准确实现复杂模型结构并完成大规模训练实验

具备良好的科研品味、独立思考能力与跨团队协作沟通能力，对前沿问题有持续热情，敢于挑战现有范式

工作职责

Agentic RL 基础算法研究：探索面向长程多步任务的强化学习训练范式，包括稀疏奖励下的信用分配、过程奖励建模、自我博弈与多智能体协同、可扩展的 reward modeling，以及训练稳定性与样本效率优化

目标是实现Agent 能力增长的主引擎

Search Agent 能力构建：研发面向开放域复杂查询的搜索智能体，覆盖多轮检索规划、查询改写、证据聚合、多源信息冲突消解与可信溯源

重点突破"深度研究"类长程任务（Deep Research）的端到端 RL 训练，让模型在数十步检索-推理交织中保持目标产出高质量分析内容

生活服务助理 Agent：解决美团真实业务环境中（餐饮、出行、到店、履约等多业务横跨）实现智能助理的基础问题，研究多工具长链调用、澄清和主动服务、个性化记忆与偏好建模、跨会话状态管理，以及面向真实用户反馈的RL 闭环

优先资格

参与过千卡级大模型训练或 RL 大规模训练 infra 建设

在 GitHub 有高 star 开源项目，或在大模型 / Agent 领域知名开源社区有持续贡献

ACM/ICPC、NOI/IOI、Kaggle 等竞赛获奖者优先

AI 洞察

优缺点分析

优点

研究平台顶级：美团核心业务数据与算力资源丰富，直接接触亿级用户场景
导师制与自由探索文化，鼓励论文产出，学术与产业两不误
团队技术氛围浓厚，与Infra、产品紧密协作，综合能力提升快
研究难度高：长程Agent训练面临稀疏奖励、稳定性等开放难题，需要较强抗压能力
竞争激烈：全球顶尖人才汇聚，需要保持持续学习与创新
工作节奏较快：北京现场办公，涉及多业务横跨，需高效沟通与协作

缺点 / 挑战

适合具备强科研背景、热爱挑战、希望在大模型与Agent前沿领域快速成长的顶尖博士/硕士

角色解读

成长为Agent方向的核心研究员，主导下一代智能体技术突破
在美团海量真实场景中打磨算法，有机会成为技术Leader
积累学术影响力，持续产出顶会论文，实现学术与产业双闭环
研究面向长程多步任务的强化学习算法，包括稀疏奖励、过程奖励建模等，提升Agent推理能力
构建搜索智能体，实现多轮检索规划、证据聚合与可信溯源，攻克深度研究类任务
落地生活服务助理Agent，解决多工具调用、用户记忆与跨会话状态管理等真实场景问题
扎实的强化学习与深度学习理论基础，熟悉RLHF、PPO等前沿方法
精通Python和PyTorch，能高效实现复杂模型并进行大规模分布式训练
顶会论文发表经验，具备独立科研能力与良好的工程落地意识

申请策略

多了解美团的业务场景（餐饮、出行、到店），在面试中结合具体场景提出你的研究思路
展示对前沿技术的热情与独立思考，可以提前准备1-2个你想探索的研究方向
突出顶会一作论文，详细说明在RL/Agent/LLM方向的技术贡献
强调大规模训练经验（千卡级）或开源项目影响力
展示代码能力和工程实现细节，如分布式训练框架优化
系统复习强化学习核心算法，特别是RLHF、DPO、过程奖励建模
动手实践Agent框架，如LangChain、AutoGPT，熟悉搜索与工具调用流程
准备一个与Search Agent或生活服务相关的项目Demo或想法

面试指南

采用STAR法则：说明背景、任务、行动、结果，重点突出你的创新点与工程实践
分析问题本质：先拆解问题要求，再提出一个核心挑战，然后给出你的解决方案和备选方案
结合美团实际场景：将通用方法映射到餐饮、出行等业务，展示业务理解深度
请介绍一下你的顶会论文，你如何看待它在大模型Agent领域的应用？
在长程任务中，如何解决稀疏奖励下的信用分配问题？
请设计一个多工具调用的Agent系统，如何处理工具召回和结果聚合？
如何评估一个搜索智能体的回答质量？你有哪些评测指标？
你如何看待RLHF与过程奖励模型在Agent训练中的优缺点？

职位点评

综合评分

顶尖校招算法岗，前沿Agent研究方向，资源与成长空间极佳，但现场办公且WLB未知。

从起薪待遇、成长路径、工作节奏和岗位方向综合评估，方便比较职业起点。

更适合这类人

最适合理想驱动、追求技术极致与学术成就、不太在意工作生活平衡的研究型人才。

表现最好

成长发展

相对薄弱

工作生活

薪资福利60

成长发展95

工作生活50

使命价值75

薪资福利

60中等

薪资未在JD中披露，但校招大厂算法岗整体市场水准较高，福利待定，补偿性动机满足程度一般。

薪资信号未披露（AI估算：25K-40K/月）

成长发展

95较高

研究前沿、资源充足、有导师制和研究自由，发展性动机获得极大满足。

技术前沿前沿/新兴技术

技术栈大语言模型、强化学习、Agent、多模态、PyTorch、分布式训练

成长机会专属带教导师、教研自由、成长路径

业务类型ambiguous

工作生活

50较低

仅现场办公，未提及弹性工作或WLB，北京办公生活节奏较快，生活动机满足一般。

工作模式仅现场办公

办公地点市区核心地段

加班情况未提及（无法判断）

使命价值

75中等

大模型是高速增长赛道，Agent技术有望改变生活服务，有一定社会意义，但非直接社会公益。

行业发展高速增长赛道

社会影响中性/一般

创新程度开拓性创新（行业首创）

美团的其他在招职位

相似职位推荐

Watch Jobs

【LongCat大模型人才校招】大模型算法研究员-Search Agent方向

职位详情

关于这个职位

最低要求

工作职责

优先资格

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

Keeta-商业分析师（经营分析）-卡塔尔

服务治理高级产品经理

食杂零售综合分析

内容传播实习生（内容编辑与设计方向）

分析应用平台研发工程师

资深AI架构师

机器人-AI算法工程师（机器视觉-实习）

研究院-图像算法工程师-杭州

海康机器人-算法工程师-智能控制-杭州

大模型算法工程师

美团的其他在招职位

Keeta-商业分析师（经营分析）-卡塔尔

服务治理高级产品经理

食杂零售综合分析

内容传播实习生（内容编辑与设计方向）

分析应用平台研发工程师

相似职位推荐

资深AI架构师

机器人-AI算法工程师（机器视觉-实习）

研究院-图像算法工程师-杭州

海康机器人-算法工程师-智能控制-杭州

大模型算法工程师

【LongCat大模型人才校招】大模型算法研究员-Search Agent方向

职位详情

关于这个职位

最低要求

工作职责

优先资格

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

美团 的其他在招职位

Keeta-商业分析师（经营分析）-卡塔尔

服务治理高级产品经理

食杂零售综合分析

内容传播实习生（内容编辑与设计方向）

分析应用平台研发工程师

相似职位推荐

资深AI架构师

机器人-AI算法工程师（机器视觉-实习）

研究院-图像算法工程师-杭州

海康机器人-算法工程师-智能控制-杭州

大模型算法工程师

美团的其他在招职位