Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/美团/【大模型北斗实习】Operator 智能体方向算法研究
Meituan logo
M
美团 (Meituan)

职位信息

北京市
初级经验
实习生
仅现场办公
学历未注明
实习/见习

标签

PyTorch强化学习多模态算法研究PPO大语言模型 (Llm)智能体 (Agent)Openai Operator
💡

核心评价

顶尖大厂AI前沿研究实习,技术成长性极佳,薪资符合市场,工作地点固定。

【大模型北斗实习】Operator 智能体方向算法研究

🤖 AI 估测:¥8K-15K

发布时间:25 天前

立即应聘

ℹ️关于这个职位

这是一个专注于大模型与强化学习结合的算法研究实习岗位
你将研究如何让智能体(Agent)在多模态和复杂场景下具备更强的决策与执行能力,核心工作包括设计强化学习环境、优化决策策略以及结合大模型进行规划推理
这是一个能让你深入接触AI前沿技术(如OpenAI Operator、LLM+RL)的绝佳机会

✓工作职责

主要研究内容包括但不限于:
1) 多模态与多步决策:设计并构建包含多模态信息、计算机交互、网络搜索、函数调用等多维度的复杂环境,研究如何利用端到端强化学习来进行多步决策,从而完成更具挑战的任务
2) 策略学习与优化:在多种强化学习算法(如 PPO、GRPO 等)的框架下,探索高效的策略优化方法,为 Operator Agent 提供强大的决策和执行能力
3) 规划与推理:借助大模型的知识与推理能力,设计可解释的多步规划算法
研究如何与外部工具或知识库交互,以扩展 Agent 的能力边界并提升其在真实环境中的自动化决策表现

⭐最低要求

1)熟悉强化学习领域常用算法及理论基础(如 DQN、Policy Gradient、PPO、GRPO 等
2)熟练掌握至少一门编程语言(如 Python、Java),熟悉 Linux 环境
3)具备深度学习框架(如 PyTorch、TensorFlow)实际项目经验
了解大模型或分布式训练框架(Megatron、DeepSpeed 等)者优先
4)对大模型在 Agent 规划、推理中的作用有浓厚兴趣,对 LLM + RL 的前沿研究有基本认识
5)具备良好的问题分析和解决能力,对新技术保持学习和探索的热情

👍优先资格

加分项:
1)在 NeurIPS、ICLR、ICML、ACL、EMNLP 等相关领域高水平期刊/会议发表论文或在有影响力的开源项目中做出核心贡献
2)在多 Agent、层级强化学习或多模态融合等领域有深入研究或项目经验者优先
3)具备 General Agent 使用经验(如 OpenAI Operator、Manus AI 等)者优先
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

美团 的其他在招职位

  • 招聘负责人

    美团

    上海市 · 仅现场办公

  • Operations Data Analyst Intern

    美团

    北京市 · 仅现场办公

  • 广州经营主管

    美团

    佛山市 · 仅现场办公

  • 核心本地商业招聘经理-上海

    美团

    上海市 · 仅现场办公

  • 生产主管

    美团

    广州市 · 仅现场办公

相似职位推荐

  • 多模态实习生

    叠纸游戏

    上海市 · 仅现场办公

  • 大模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 图形图像算法实习生

    叠纸游戏

    图形图像算法实习生 · 仅现场办公

  • 算法工程师(武汉)

    多点数智

    武汉市 · 仅现场办公

  • 算法工程师(北京)

    多点数智

    北京市 · 仅现场办公