Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Meituan logo
美团
【LongCat大模型人才校招】大模型算法研究员-Search Agent方向
立即应聘

【LongCat大模型人才校招】大模型算法研究员-Search Agent方向

发布于 大约 16 小时前

普通员工/个人贡献者

北京市
初级经验
全职员工
仅现场办公
硕士
研究与开发 (研发)
PyTorch
强化学习
NeurIPS
ICML
ICLR
多模态
大语言模型
Search Agent

AI 估算 · 25k–40k

校招顶尖博士/硕士,大模型方向火热,美团薪资有竞争力,参考一线互联网算法岗

职位详情

关于这个职位

美团LongCat团队正在招聘大模型算法研究员,专注于Search Agent方向

你将参与下一代智能体的范式探索,研究Agentic RL、搜索智能体与生活服务助理Agent,在亿级真实用户场景中实现算法落地
适合对强化学习、大语言模型和Agent有浓厚兴趣、希望发表顶会论文的顶尖人才

最低要求

全球 Top 高校计算机科学、人工智能、数学或相关领域博士或硕士

在 NeurIPS、ICML、ICLR、ACL、EMNLP等大模型领域顶级会议以第一作者发表过论文,研究方向与大语言模型、强化学习、Agent、多模态模型等强相关
在大语言模型、强化学习、Agent、多模态等方向中至少一个领域有扎实的理论基础与实践经验,能独立完成从问题定义、方法设计、系统开发、实验验证的完整工作闭环,并深度使用AI工具辅助完成
扎实的代码功底,能高效准确实现复杂模型结构并完成大规模训练实验
具备良好的科研品味、独立思考能力与跨团队协作沟通能力,对前沿问题有持续热情,敢于挑战现有范式

工作职责

Agentic RL 基础算法研究:探索面向长程多步任务的强化学习训练范式,包括稀疏奖励下的信用分配、过程奖励建模、自我博弈与多智能体协同、可扩展的 reward modeling,以及训练稳定性与样本效率优化

目标是实现Agent 能力增长的主引擎
Search Agent 能力构建:研发面向开放域复杂查询的搜索智能体,覆盖多轮检索规划、查询改写、证据聚合、多源信息冲突消解与可信溯源
重点突破"深度研究"类长程任务(Deep Research)的端到端 RL 训练,让模型在数十步检索-推理交织中保持目标产出高质量分析内容
生活服务助理 Agent:解决美团真实业务环境中(餐饮、出行、到店、履约等多业务横跨)实现智能助理的基础问题,研究多工具长链调用、澄清和主动服务、个性化记忆与偏好建模、跨会话状态管理,以及面向真实用户反馈的RL 闭环

优先资格

参与过千卡级大模型训练或 RL 大规模训练 infra 建设

在 GitHub 有高 star 开源项目,或在大模型 / Agent 领域知名开源社区有持续贡献
ACM/ICPC、NOI/IOI、Kaggle 等竞赛获奖者优先

AI 洞察

优缺点分析

优点

  • 研究平台顶级:美团核心业务数据与算力资源丰富,直接接触亿级用户场景
  • 导师制与自由探索文化,鼓励论文产出,学术与产业两不误
  • 团队技术氛围浓厚,与Infra、产品紧密协作,综合能力提升快
  • 研究难度高:长程Agent训练面临稀疏奖励、稳定性等开放难题,需要较强抗压能力
  • 竞争激烈:全球顶尖人才汇聚,需要保持持续学习与创新
  • 工作节奏较快:北京现场办公,涉及多业务横跨,需高效沟通与协作

缺点 / 挑战

  • 适合具备强科研背景、热爱挑战、希望在大模型与Agent前沿领域快速成长的顶尖博士/硕士

角色解读

  • 成长为Agent方向的核心研究员,主导下一代智能体技术突破
  • 在美团海量真实场景中打磨算法,有机会成为技术Leader
  • 积累学术影响力,持续产出顶会论文,实现学术与产业双闭环
  • 研究面向长程多步任务的强化学习算法,包括稀疏奖励、过程奖励建模等,提升Agent推理能力
  • 构建搜索智能体,实现多轮检索规划、证据聚合与可信溯源,攻克深度研究类任务
  • 落地生活服务助理Agent,解决多工具调用、用户记忆与跨会话状态管理等真实场景问题
  • 扎实的强化学习与深度学习理论基础,熟悉RLHF、PPO等前沿方法
  • 精通Python和PyTorch,能高效实现复杂模型并进行大规模分布式训练
  • 顶会论文发表经验,具备独立科研能力与良好的工程落地意识

申请策略

  • 多了解美团的业务场景(餐饮、出行、到店),在面试中结合具体场景提出你的研究思路
  • 展示对前沿技术的热情与独立思考,可以提前准备1-2个你想探索的研究方向
  • 突出顶会一作论文,详细说明在RL/Agent/LLM方向的技术贡献
  • 强调大规模训练经验(千卡级)或开源项目影响力
  • 展示代码能力和工程实现细节,如分布式训练框架优化
  • 系统复习强化学习核心算法,特别是RLHF、DPO、过程奖励建模
  • 动手实践Agent框架,如LangChain、AutoGPT,熟悉搜索与工具调用流程
  • 准备一个与Search Agent或生活服务相关的项目Demo或想法

面试指南

  • 采用STAR法则:说明背景、任务、行动、结果,重点突出你的创新点与工程实践
  • 分析问题本质:先拆解问题要求,再提出一个核心挑战,然后给出你的解决方案和备选方案
  • 结合美团实际场景:将通用方法映射到餐饮、出行等业务,展示业务理解深度
  • 请介绍一下你的顶会论文,你如何看待它在大模型Agent领域的应用?
  • 在长程任务中,如何解决稀疏奖励下的信用分配问题?
  • 请设计一个多工具调用的Agent系统,如何处理工具召回和结果聚合?
  • 如何评估一个搜索智能体的回答质量?你有哪些评测指标?
  • 你如何看待RLHF与过程奖励模型在Agent训练中的优缺点?

匹配度报告

70
综合匹配度

顶尖校招算法岗,前沿Agent研究方向,资源与成长空间极佳,但现场办公且WLB未知。

适合人群
最适合理想驱动、追求技术极致与学术成就、不太在意工作生活平衡的研究型人才。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利60
成长发展95
工作生活50
使命价值75

薪资福利匹配

60中等

薪资未在JD中披露,但校招大厂算法岗整体市场水准较高,福利待定,补偿性动机满足程度一般。

薪资信号未披露(AI估算:25K-40K/月)

成长发展匹配

95较高

研究前沿、资源充足、有导师制和研究自由,发展性动机获得极大满足。

技术前沿前沿/新兴技术
技术栈大语言模型、强化学习、Agent、多模态、PyTorch、分布式训练
成长机会专属带教导师、教研自由、成长路径
业务类型ambiguous

工作生活匹配

50较低

仅现场办公,未提及弹性工作或WLB,北京办公生活节奏较快,生活动机满足一般。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

75中等

大模型是高速增长赛道,Agent技术有望改变生活服务,有一定社会意义,但非直接社会公益。

行业发展高速增长赛道
社会影响中性/一般
创新程度开拓性创新(行业首创)
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

美团 的其他在招职位

  • 【北斗】基于大模型的搜索算法工程师

    美团 · 北京市
    AI 估算 · 6k-10k
  • 【北斗】广告大模型应用算法工程师-【多国多语言LLM-based 推搜广告】

    美团 · 北京市
    AI 估算 · 25k-35k
  • 市场营销实习生

    美团 · 北京市
    AI 估算 · 4k-6k
  • 【LongCat大模型人才校招】基础模型通用 agent 算法研究员

    美团 · 北京市
    AI 估算 · 20k-30k
  • 【北斗】AI决策算法研究员(外卖/即时零售方向)

    美团 · 北京市
    AI 估算 · 25k-45k

相似职位推荐

  • 大模型应用算法工程师-电商业务

    小红书 · 北京市
    AI 估算 · 25k-45k
  • MaaS模型评测高级工程师

    腾讯 · 深圳市
    AI 估算 · 30k-60k
  • SW Engineer (Campus)

    大众汽车 · 合肥市
    AI 估算 · 8k-12k
  • 工程技师,合规测试 Engineering Technician, Compliance Test

    特斯拉 · 上海市
    AI 估算 · 20k-35k
  • AI算法实习生

    三七互娱 · 广州市
    AI 估算 · 4k-8k

美团 的其他在招职位

  • 【北斗】基于大模型的搜索算法工程师

    美团 · 北京市
    AI 估算 · 6k-10k
  • 【北斗】广告大模型应用算法工程师-【多国多语言LLM-based 推搜广告】

    美团 · 北京市
    AI 估算 · 25k-35k
  • 市场营销实习生

    美团 · 北京市
    AI 估算 · 4k-6k
  • 【LongCat大模型人才校招】基础模型通用 agent 算法研究员

    美团 · 北京市
    AI 估算 · 20k-30k
  • 【北斗】AI决策算法研究员(外卖/即时零售方向)

    美团 · 北京市
    AI 估算 · 25k-45k

相似职位推荐

  • 大模型应用算法工程师-电商业务

    小红书 · 北京市
    AI 估算 · 25k-45k
  • MaaS模型评测高级工程师

    腾讯 · 深圳市
    AI 估算 · 30k-60k
  • SW Engineer (Campus)

    大众汽车 · 合肥市
    AI 估算 · 8k-12k
  • 工程技师,合规测试 Engineering Technician, Compliance Test

    特斯拉 · 上海市
    AI 估算 · 20k-35k
  • AI算法实习生

    三七互娱 · 广州市
    AI 估算 · 4k-8k