美团的【基座大模型北斗实习】开放域智能体交互与自动化评测演进机制研究薪资是多少？

该职位薪资范围为 8k–15k（人民币/月）。

【基座大模型北斗实习】开放域智能体交互与自动化评测演进机制研究的工作地点在哪里？

该职位工作地点位于北京市。工作形式为仅现场办公。

该职位要求硕士学历及其它工作经验。

🤖 AI 估测：¥8K-15K

发布时间：22 天前

这是一个专注于前沿AI智能体（Agent）评测机制研究的实习岗位

你将参与构建动态评测沙盒环境，研究如何量化智能体的长程规划、自主纠错与真实环境交互能力，并探索下一代智能体的评测基准

评测范式研究与落地：

①针对 OpenClaw 及 Claude Code 等主流 Agent，构建基于真实生产力场景，如自动化办公、复杂代码重构、多工具协同等的动态评测沙盒环境

②探索从“单轮对话”转向“长程任务”的评测机制，研究如何量化 Agent 的记忆一致性与环境感知力

高价值方案产出：

①设计并构建能反映用户体感的评测集，不仅关注通过率，更深入拆解用户在交互过程中的使用体验

②建立 Agent 错误归因体系，针对 Agent 陷入死循环、幻觉指令、工具调用失败等典型场景进行深度诊断

未来形态探索：

①跟踪前沿 Agent 发展，研究在多智能体协同、自主进化等未来形态下的 Agent 形态和相应的评测基准

②利用 LLM/Agent-as-a-Judge 的方式，提升自动化评测的准确性与效率

硕士及以上学历，计算机或相关专业，博士优先

在 ML / NLP / RL / CV / Speech 等相关方向有扎实的研究基础，在 ACL / EMNLP / NAACL / NeurIPS / ICML / ICLR / CVPR / ICCV / ICASSP 等顶级会议发表论文者优先

优秀的代码和算法功底，具备工匠精神，ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛获奖者优先

在大模型领域或强化学习领域，主导过大影响力的项目或论文者优先

出色的问题分析和解决能力，有自主探索、深耕一个领域的决心和定力

在顶级会议发表论文者优先

比赛获奖者优先

主导过大影响力项目或论文者优先

【基座大模型北斗实习】开放域智能体交互与自动化评测演进机制研究

🤖 AI 估测：¥8K-15K

发布时间：22 天前