Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/美团/【基座大模型北斗实习】开放域智能体交互与自动化评测演进机制研究
Meituan logo
M
美团 (Meituan)

职位信息

北京市
其它
实习生
仅现场办公
硕士
实习/见习

标签

机器学习NLP算法强化学习LLM大模型评测
💡

核心评价

前沿AI Agent评测研究实习,技术成长性极佳,位于北京大厂,WLB信息不明。

【基座大模型北斗实习】开放域智能体交互与自动化评测演进机制研究

🤖 AI 估测:¥8K-15K

发布时间:22 天前

立即应聘

ℹ️关于这个职位

这是一个专注于前沿AI智能体(Agent)评测机制研究的实习岗位
你将参与构建动态评测沙盒环境,研究如何量化智能体的长程规划、自主纠错与真实环境交互能力,并探索下一代智能体的评测基准

✓工作职责

评测范式研究与落地:
①针对 OpenClaw 及 Claude Code 等主流 Agent,构建基于真实生产力场景,如自动化办公、复杂代码重构、多工具协同等的动态评测沙盒环境
②探索从“单轮对话”转向“长程任务”的评测机制,研究如何量化 Agent 的记忆一致性与环境感知力
高价值方案产出:
①设计并构建能反映用户体感的评测集,不仅关注 通过率,更深入拆解用户在交互过程中的使用体验
②建立 Agent 错误归因体系,针对 Agent 陷入死循环、幻觉指令、工具调用失败等典型场景进行深度诊断
未来形态探索:
①跟踪前沿 Agent 发展,研究在多智能体协同、自主进化等未来形态下的 Agent 形态和相应的评测基准
②利用 LLM/Agent-as-a-Judge 的方式,提升自动化评测的准确性与效率

⭐最低要求

硕士及以上学历,计算机或相关专业,博士优先
在 ML / NLP / RL / CV / Speech 等相关方向有扎实的研究基础,在 ACL / EMNLP / NAACL / NeurIPS / ICML / ICLR / CVPR / ICCV / ICASSP 等顶级会议发表论文者优先
优秀的代码和算法功底,具备工匠精神,ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛获奖者优先
在大模型领域或强化学习领域,主导过大影响力的项目或论文者优先
出色的问题分析和解决能力,有自主探索、深耕一个领域的决心和定力

👍优先资格

在顶级会议发表论文者优先
比赛获奖者优先
主导过大影响力项目或论文者优先
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

美团 的其他在招职位

  • 招聘负责人

    美团

    上海市 · 仅现场办公

  • Operations Data Analyst Intern

    美团

    北京市 · 仅现场办公

  • 广州经营主管

    美团

    佛山市 · 仅现场办公

  • 核心本地商业招聘经理-上海

    美团

    上海市 · 仅现场办公

  • 生产主管

    美团

    广州市 · 仅现场办公

相似职位推荐

  • 多模态实习生

    叠纸游戏

    上海市 · 仅现场办公

  • 大模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 图形图像算法实习生

    叠纸游戏

    图形图像算法实习生 · 仅现场办公

  • 算法工程师(武汉)

    多点数智

    武汉市 · 仅现场办公

  • 算法工程师(北京)

    多点数智

    北京市 · 仅现场办公