Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/美团/Agent Research Intern(大模型智能体学习方向)
Meituan logo
M
美团 (Meituan)

职位信息

北京市
无经验要求
实习生
仅现场办公
本科
实习/见习

标签

PyTorch研究能力论文复现大语言模型 (Llm)强化学习 (Rl)智能体 (Agent)在线学习 (Online Learning)记忆机制过程奖励模型 (Prm)
💡

核心评价

顶尖平台的前沿AI研究实习,成长性极佳,薪资符合市场,工作地点固定。

Agent Research Intern(大模型智能体学习方向)

🤖 AI 估测:¥8K-15K

发布时间:25 天前

立即应聘

ℹ️关于这个职位

这是一个专注于大模型智能体(Agent)前沿研究的实习岗位
你将参与Agent后训练、在线学习、记忆机制、过程奖励模型等核心方向的研究,并负责搭建实验环境、复现前沿成果,最终产出高质量的技术报告或论文
适合希望在LLM Agent、强化学习、推理等方向深入发展的同学

✓工作职责

参与面向 Agent 的大模型后训练新范式研究,包括但不限于:基于轨迹的后训练、面向工具使用与环境交互的策略优化、面向长时程任务的能力塑造等
参与 On-policy learning 与 Online learning 在智能体场景中的方法探索与系统落地,研究如何在真实或半真实环境中提升模型的持续交互、试错学习与在线改进能力
参与 智能体记忆机制研究,包括长期记忆、工作记忆、情景记忆、可检索记忆与记忆治理等方向,探索记忆对长时程任务、多轮规划与复杂决策能力的作用
参与过程奖励模型(Process Reward Model, PRM)及相关可验证反馈机制研究,探索如何为 Agent 的中间步骤、行为轨迹与决策过程提供更细粒度、更稳定的学习信号
参与搭建和迭代 Agent 研究所需的实验范式,包括环境构建、数据生成、评测基准、自动化分析工具与训练基础设施,推动研究从想法验证走向稳定复现
跟进并复现学界与业界研究进展,围绕 Agent learning、RL for LLM、记忆、工具使用、可验证性等方向开展深入调研、实验与总结,形成高质量技术报告、研究原型或论文产出

⭐最低要求

计算机、人工智能、数学、统计学、电子信息或相关专业本科高年级、硕士或博士在读
具备扎实的机器学习基础,对以下至少一个方向有较深入理解:
大语言模型与后训练
强化学习 / Online learning / Bandit / Sequence decision making
Agent / Tool use / Planning / Reasoning
记忆增强模型 / RAG / 长上下文建模
Reward modeling / Preference learning / PRM / ORM
熟悉 Python,具备较强的工程实现能力,能够独立完成实验、调参与结果分析
熟悉 PyTorch,并具有一定的大模型训练或推理实践经验
具备较强的论文阅读、问题抽象与实验设计能力,能够围绕一个研究问题提出清晰假设、设计验证方案并推进落地
具备良好的沟通协作能力与研究主动性,能够在不确定性较高的前沿问题中快速学习、持续推进
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

美团 的其他在招职位

  • 招聘负责人

    美团

    上海市 · 仅现场办公

  • Operations Data Analyst Intern

    美团

    北京市 · 仅现场办公

  • 广州经营主管

    美团

    佛山市 · 仅现场办公

  • 核心本地商业招聘经理-上海

    美团

    上海市 · 仅现场办公

  • 生产主管

    美团

    广州市 · 仅现场办公

相似职位推荐

  • 多模态实习生

    叠纸游戏

    上海市 · 仅现场办公

  • 大模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 图形图像算法实习生

    叠纸游戏

    图形图像算法实习生 · 仅现场办公

  • 算法工程师(武汉)

    多点数智

    武汉市 · 仅现场办公

  • 算法工程师(北京)

    多点数智

    北京市 · 仅现场办公