Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Meituan logo
美团
LongCat - 大模型自进化与自动化研究智能体研究员
立即应聘

LongCat - 大模型自进化与自动化研究智能体研究员

发布于 大约 14 小时前

普通员工/个人贡献者

北京市
高级经验
全职员工
仅现场办公
硕士
PyTorch
强化学习
自然语言处理
大模型
vLLM
自动化研究
自进化

AI 估算 · 30k–60k

北京大厂高级AI研究员岗位,技能稀缺(大模型自进化),薪资竞争力强,参考市场水平。

职位详情

关于这个职位

该职位是美团基础研发平台的核心研究岗,专注于研发下一代自动化研究智能体系统,面向大模型的自进化与自动化

你将参与构建从问题发现到策略迭代的完整闭环,提升模型在长周期复杂任务中的自主规划和执行能力
团队在ICLR、NeurIPS等顶会发表多篇论文,资源充裕,适合有志于AGI前沿技术的研究型人才

最低要求

扎实的算法功底,熟悉自然语言处理和机器学习技术,对大模型和AGI有信仰

熟悉Python/Java等编程语言,动手能力强,ACM/ICPC、NOI/IOI等比赛获奖者优先
熟悉PyTorch/Megtron/Huggingface/Triton/vLLM/SGLang等框架并有实际项目经验
在领域内顶级会议或期刊发表过高水平论文,主导或参与过有影响力的开源项目,在权威评测或比赛中取得优秀名次者优先

工作职责

研发下一代自动化研究智能体系统,面向模型研发与高价值复杂研究任务,构建从问题发现、假设生成、实验执行到结果验证、经验沉淀、策略迭代的自进化闭环

提升模型在长周期任务中的自主规划和执行能力,减少对人工逐步指导的依赖,并将能力改进应用于模型训练与评测体系,形成持续迭代
自动化研究智能体能力建设:提升模型在复杂任务分解、长程推理、研究规划、工具使用、代码生成与执行、证据链整合、结果归因和研究报告生成中的闭环能力,面向真实模型研发任务验证效果
长程上下文、记忆与状态管理:设计 context scaling/compression、memory selection、任务状态追踪等机制,解决长周期任务中的一致性衰减、状态丢失和中断恢复问题
可验证研究环境与自动实验闭环:构建覆盖 search、browser、retrieval、code execution、training/eval job、sandbox 的交互式研究环境,将任务建模为可交互、可验证、可评分的闭环,支持自动实验编排、结果比对与版本回滚
训练策略与反馈信号设计:设计数据配方、环境反馈和 reward 信号体系,引导模型在事实正确性、工具调用可靠性和任务完成率上持续提升
评测体系与错误分析闭环:建设面向真实 research workflow 的 benchmark 与自动评测体系
系统性分析 Agent 的典型失败模式,针对性反哺到训练策略和 harness 优化
研究经验沉淀与策略自进化:将成功/失败任务轨迹沉淀为 research episode、skill 和 eval case 等可检索、可复用的自动研究策略库,支持 Agent 在后续任务中检索、复用和迭代

AI 洞察

优缺点分析

优点

  • 处于AI最前沿的大模型自进化与智能体方向,技术成长空间极大
  • 美团提供充足的算力和数据资源,团队学术氛围浓厚,人才密度高
  • 团队在顶会发表多篇论文,有良好的科研环境和合作资源
  • 研究难度高,需要极强的自主驱动力和解决开放问题的能力
  • 工作强度可能较大,需要持续跟进最新论文和技术进展
  • 作为研究岗位,产出周期较长,需要耐心和抗压能力
  • 适合有扎实算法功底、对AGI有强烈兴趣、渴望在技术前沿做出突破的研究型人才

缺点 / 挑战

暂无明显挑战项

角色解读

  • 技术方向:从研究员到资深研究员,再到技术专家或首席科学家,主导前沿技术方向
  • 管理方向:可转为团队负责人或技术总监,带领研究团队
  • 跨领域:研究成果可应用于美团多个业务场景,如搜索、推荐、无人配送等,拓展技术影响力
  • 设计并实现自动化研究智能体,使大模型能够自主完成复杂研究任务,如问题分解、实验设计、代码编写与结果分析
  • 开发长程记忆与上下文管理机制,解决多步骤任务中的状态丢失和一致性衰减问题
  • 构建可验证的研究环境,整合搜索、浏览器、代码执行等工具,形成自动化实验闭环
  • 设计训练策略与反馈信号,通过强化学习引导模型提升在事实正确性和任务完成率上的表现
  • 扎实的算法与机器学习基础,熟悉NLP和深度学习技术,对大模型原理有深入理解
  • 精通Python,熟悉PyTorch、vLLM、Hugging Face等框架,具备分布式训练经验者优先
  • 具备强化学习或智能体研究经验,了解context scaling、memory selection等技术
  • 优秀的科研能力,有顶会论文或重大开源项目贡献

申请策略

  • 在面试中展示你对大模型自进化的理解和创意,最好能提出一个你感兴趣的研究方向
  • 提前了解美团基础研发平台的技术博客和开源项目,展现对公司和团队的认同
  • 突出相关顶会论文(如ICLR、NeurIPS、ACL等),说明你的创新点和实际贡献
  • 强调大模型或强化学习项目经验,尤其是智能体、自进化、长程推理相关
  • 列出开源项目贡献或比赛获奖经历,体现动手能力和工程水平
  • 详细描述你解决复杂问题的技术方案和成果
  • 补充强化学习基础知识,特别是PPO、REINFORCE等算法
  • 熟悉主流大模型训练框架(Megatron、DeepSpeed)和推理优化工具(vLLM、SGLang)

面试指南

  • 结构化回答:先明确问题定义,再分模块讲解你的设计思路,最后总结挑战与解决方案
  • 结合项目实例:用具体的论文或项目经验作为支撑,展示你的技术深度
  • 请介绍一下你在大模型或智能体方向上的研究经历,解决了什么问题?
  • 如何设计一个自动化研究智能体?需要考虑哪些关键技术?
  • 如何解决长程任务中的记忆丢失和状态不一致问题?
  • 你对大模型自进化(Self-evolving)的定义是什么?有哪些可行路径?
  • 请用强化学习框架描述一个智能体训练流程,并说明reward设计
  • 复习大模型基础(Transformer、RLHF、SFT等),准备一个你参与的相关项目详细介绍

匹配度报告

78
综合匹配度

前沿大模型自进化研究方向,发展空间极大,但工作强度高,WLB一般。

适合人群
适合追求技术前沿和个人成长、能接受高强度工作的研究者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利80
成长发展95
工作生活50
使命价值85

薪资福利匹配

80较高

美团作为上市巨头,薪资福利具有竞争力,但岗位未明确具体薪酬,属于面议范畴。整体补偿性动机满足程度较高。

薪资信号面议 (30K-60K/月)

成长发展匹配

95较高

该岗位聚焦前沿技术(大模型自进化、智能体),有充足算力和数据支持,团队学术产出丰厚,成长空间极大。

技术前沿前沿/新兴技术
技术栈大模型、强化学习、智能体、自进化、PyTorch、vLLM、Hugging Face
成长机会团队扁平、人才密度高、顶会论文、长期有耐心
业务类型profit_center

工作生活匹配

50较低

工作地点北京仅现场办公,JD未提及弹性工作或WLB,推测属于高强度研究岗,生活化动机满足一般。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值匹配

85较高

岗位致力于推动AGI技术发展,团队多次获奖,有较高社会影响力和创新性。

行业发展高速增长赛道
社会影响正向社会影响力较高
使命信号驱动技术发展、创造行业价值
创新程度开拓性创新(行业首创)
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

美团 的其他在招职位

  • 政府投诉调解(驻所A)

    美团 · 北京市
    AI 估算 · 8k-15k
  • 商家端产品运营

    美团 · 北京市
    AI 估算 · 18k-30k
  • 用户体验调研运营(NPS方向)

    美团 · 北京市
    AI 估算 · 18k-28k
  • 充电宝-下沉战区-销售BD(渤海区域-保定、廊坊、烟台、威海、张家口、吉林、邯郸、潍坊、东营、太原)

    美团 · 保定市
    AI 估算 · 6k-15k
  • 视频拍摄及制作项目实习(客户案例&产品方向)

    美团 · 北京市
    AI 估算 · 4k-7k

相似职位推荐

  • 大模型评测算法工程师-AI数据与安全

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 大模型评测算法工程师-AI数据与安全

    字节跳动 · 深圳市
    AI 估算 · 25k-45k
  • 智能系统评估研究科学家-Commercial AI

    字节跳动 · 北京市
    AI 估算 · 35k-65k
  • 视觉感知算法工程师-PICO

    字节跳动 · 北京市
    AI 估算 · 30k-45k
  • 番茄模型运维(模型开发方向)运营-CQC

    字节跳动 · 北京市
    AI 估算 · 30k-50k

美团 的其他在招职位

  • 政府投诉调解(驻所A)

    美团 · 北京市
    AI 估算 · 8k-15k
  • 商家端产品运营

    美团 · 北京市
    AI 估算 · 18k-30k
  • 用户体验调研运营(NPS方向)

    美团 · 北京市
    AI 估算 · 18k-28k
  • 充电宝-下沉战区-销售BD(渤海区域-保定、廊坊、烟台、威海、张家口、吉林、邯郸、潍坊、东营、太原)

    美团 · 保定市
    AI 估算 · 6k-15k
  • 视频拍摄及制作项目实习(客户案例&产品方向)

    美团 · 北京市
    AI 估算 · 4k-7k

相似职位推荐

  • 大模型评测算法工程师-AI数据与安全

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 大模型评测算法工程师-AI数据与安全

    字节跳动 · 深圳市
    AI 估算 · 25k-45k
  • 智能系统评估研究科学家-Commercial AI

    字节跳动 · 北京市
    AI 估算 · 35k-65k
  • 视觉感知算法工程师-PICO

    字节跳动 · 北京市
    AI 估算 · 30k-45k
  • 番茄模型运维(模型开发方向)运营-CQC

    字节跳动 · 北京市
    AI 估算 · 30k-50k