Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Meituan logo
美团
【LongCat实习】基础模型通用 agent 算法研究员
立即应聘

【LongCat实习】基础模型通用 agent 算法研究员

发布于 大约 11 小时前

实习/见习

北京市
无经验要求
实习生
仅现场办公
本科
研究与开发 (研发)
强化学习
多模态
大模型训练
群体智能
Post-Training
Rl Scaling
Credit Assignment
Self-Evolution

AI 估算 · 4k–8k

美团核心部门算法实习,薪资具有竞争力,且提供GPU资源,实习月薪在4000-8000元之间。

职位详情

关于这个职位

该职位是美团基础模型团队的前沿算法研究实习岗位,专注于构建具备全模态交互和复杂长程任务能力的AI Agent系统

你将参与RL Scaling、自进化系统、多模态推理与群体智能等核心方向的研究,与高密度人才团队合作,探索最开放的AI问题
适合对强化学习与大模型有强烈热情、追求技术突破的在校生

最低要求

届获得本科及以上学历,计算机、人工智能、自动化、数学、物理等相关专业

好奇心驱动,对追求纯粹的技术有强烈热情,擅于迭代自我认知,不被惯性束缚,工作积极主动
数理基础扎实,具备第一性思考的素养和出色的分析、解决问题的能力,能够自主探索可靠的解决方案
具有良好的沟通协作能力,能够与团队融洽合作,一起探索新技术并快速试验想法,推进技术进步

工作职责

探索小时或者天级别复杂长程任务下的RL Scaling等可靠后训练范式,实现有效的探索引导和credit assignment,并保障训练的robustness、efficiency & effectiveness

探索模型的自进化系统构建方案,在易于模型理解使用的前提下,训练模型以更高信息密度的形态构建、维护和利用memory / skills,使模型能主动在重复性任务或封闭任务域中总结、提炼认知与经验,并进行有效复用,达到不断自进化的效果
探索多模态推理和多模态环境交互的范式,尤其关注真实物理世界级别的动态环境,并基于此训练模型在复杂全模态环境下的复杂长程任务完成能力
探索模型群体智能的演化可能性,可以自主进行合理的任务拆解、分工、协同探索与智能集成

优先资格

在强化学习、大模型训练、Agent等一个或多个领域有较深入的研究和实践经验,主导过大影响力的项目

或在 ICLR/ICML/NIPS/CVPR/ACL 等顶级会议上以一作身份发表过有影响力的学术论文
在 CMO/NOI/CPhO/ACM 等竞赛中取得过优异成绩

AI 洞察

优缺点分析

优点

  • 团队人才密度高,研究成果丰硕,能接触最前沿的技术问题,快速提升技术视野
  • 充足的GPU资源和丰富的高校合作,支持自由探索,论文产出率高
  • 工作环境优越,团队扁平,结果导向,个人成长空间大
  • 实习经历含金量高,对后续求职或深造有很大帮助
  • 研究的问题难度大、开放性强,需要较强的自驱力和抗压能力
  • 涉及多学科交叉,需要快速学习并掌握RL、多模态、进化系统等新知识

缺点 / 挑战

  • 实习期间可能面临长期高强度投入,对时间管理和精力要求较高
  • 适合对强化学习和AI Agent有强烈热情、追求技术前沿且乐于挑战的在校生,尤其是具备扎实数理基础和研究潜力的本科生或硕士生

角色解读

  • 可在强化学习、多模态AI领域深入发展,成为该方向的核心研究员
  • 有机会参与顶级会议论文发表,积累学术影响力,并转入大厂核心团队或深造读博
  • 技术能力全面,可向Agent系统架构师或AI产品负责人方向发展
  • 从事强化学习后训练范式的探索,优化复杂长程任务的探索引导和信用分配,提升训练的鲁棒性和效率
  • 设计模型自进化系统,让模型能构建和利用记忆/技能库,实现自主总结与复用,达到持续进化的效果
  • 研究多模态推理与物理环境交互范式,训练模型在真实动态环境中完成长程任务
  • 探索群体智能,使模型能自主拆解任务、分工协作并集成智能,提升整体效能
  • 扎实的数理基础和第一性思考能力,能自主分析并解决复杂问题
  • 熟悉强化学习、大模型训练或Agent等领域,有实际项目或研究经验
  • 熟练掌握Python及深度学习框架(如PyTorch),具备工程实现能力
  • 良好的沟通协作能力,能快速试验想法并与团队高效合作

申请策略

  • 面试准备时重点准备一个你最熟悉的研究或项目,能清晰阐述挑战和解决方案
  • 了解美团核心本地商业的业务场景,思考Agent如何实际落地
  • 突出强化学习、大模型训练或Agent相关项目经历,说明你的具体贡献和效果
  • 如有论文发表或竞赛获奖,务必列出,尤其是顶会一作或CMO/NOI/ACM成绩
  • 强调数理基础和分析能力,可通过课程成绩或解题经历体现
  • 展示对AI技术的热情,如个人博客、GitHub项目或参与的开源社区
  • 提前熟悉RLScaling、PPO、GRPO等强化学习算法框架,并尝试复现相关论文
  • 学习多模态模型基础(如CLIP、LLaVA)和Agent框架(如AutoGPT、CrewAI)

面试指南

  • 采用STAR法则(情境-任务-行动-结果)结构化回答项目经历,突出你的角色和技术细节
  • 对于开放性问题,先明确问题定义,再分步骤提出解决方案,体现逻辑性和第一性原理
  • 结合最新论文观点,展示你对前沿方向的关注和理解
  • 请详细介绍一下你参与过的强化学习或大模型项目,你遇到了哪些困难?如何解决的?
  • 如何设计一个能够自我进化的Agent?请谈谈你的思路
  • 你对RL Scaling有什么理解?如何提升credit assignment的效率?
  • 在多模态环境中训练长程任务,你认为最大的挑战是什么?
  • 你如何看待群体智能?能否举一个实际场景来设计多智能体协作方案?

职位点评

68
综合评分

顶尖算法实习,前沿研究导向,GPU资源充足,成长性强,但WLB未明确且需现场办公。

更适合这类人
最适合以技能成长和前沿研究为第一驱动的求职者,尤其是愿意投入时间换取顶尖技术积累的在校生。
表现最好
成长发展
相对薄弱
工作生活
薪资福利60
成长发展92
工作生活50
使命价值70

薪资福利

60中等

实习岗位薪资水平中等,但提供有竞争力的福利和GPU资源,满足基本补偿需求。

薪资信号未披露(AI估算:4K-8K/月)

成长发展

92较高

研究最前沿的AI技术,团队高密度,资源充足,成长空间极大,论文产出率高,发展性动机强烈满足。

技术前沿前沿/新兴技术
技术栈强化学习、大模型、Agent、多模态、RL Scaling、自进化系统、群体智能
成长机会良好的个人成长、发展空间、学术资源、高校合作
业务类型ambiguous

工作生活

50较低

须在北京现场实习,未明确WLB,团队结果导向,可能面临高强度工作,生活方式满足度一般。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值

70中等

AI技术对社会有潜在积极影响,但JD未明确社会价值导向,行业处于高速增长期,意义感中等偏上。

行业发展高速增长赛道
社会影响中性/一般
创新程度开拓性创新(行业首创)
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

美团 的其他在招职位

  • WMS高级产品经理

    美团 · 北京市
    AI 估算 · 25k-40k
  • Keeta-代理商解决方案产品运营(Base巴西)

    美团 · 圣保罗
    AI 估算 · 20k-35k
  • 【医药健康】医美上游商业化产品运营

    美团 · 北京市
    AI 估算 · 25k-40k
  • 快乐猴供应链计划城市负责人

    美团 · 北京市
    AI 估算 · 35k-50k
  • B端产品经理

    美团 · 北京市
    AI 估算 · 25k-35k

相似职位推荐

  • 化學實驗室-前處理人員(台北日班)

    通标标准技术服务有限公司 · Xingzhen Village, New Taipei City, Taiwan
    AI 估算 · 6k-9k
  • AI Standards & Ecosystem | Sr. Staff Engineer

    高通 · 北京市
    AI 估算 · 60k-100k
  • 具身智能算法实习生

    网易 · 杭州市
    AI 估算 · 4k-8k
  • 游戏研发实习生(引擎方向)

    网易 · 上海市
    AI 估算 · 4k-6k
  • 图形学研究员实习生(动作生成方向)

    米哈游 · 上海市
    AI 估算 · 4k-8k

美团 的其他在招职位

  • WMS高级产品经理

    美团 · 北京市
    AI 估算 · 25k-40k
  • Keeta-代理商解决方案产品运营(Base巴西)

    美团 · 圣保罗
    AI 估算 · 20k-35k
  • 【医药健康】医美上游商业化产品运营

    美团 · 北京市
    AI 估算 · 25k-40k
  • 快乐猴供应链计划城市负责人

    美团 · 北京市
    AI 估算 · 35k-50k
  • B端产品经理

    美团 · 北京市
    AI 估算 · 25k-35k

相似职位推荐

  • 化學實驗室-前處理人員(台北日班)

    通标标准技术服务有限公司 · Xingzhen Village, New Taipei City, Taiwan
    AI 估算 · 6k-9k
  • AI Standards & Ecosystem | Sr. Staff Engineer

    高通 · 北京市
    AI 估算 · 60k-100k
  • 具身智能算法实习生

    网易 · 杭州市
    AI 估算 · 4k-8k
  • 游戏研发实习生(引擎方向)

    网易 · 上海市
    AI 估算 · 4k-6k
  • 图形学研究员实习生(动作生成方向)

    米哈游 · 上海市
    AI 估算 · 4k-8k