Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

miHoYo logo
米哈游
Agent 算法研究员
立即应聘

Agent 算法研究员

发布于 大约 12 小时前

实习/见习

上海市
无经验要求
实习生
仅现场办公
硕士
PyTorch
RAG
LLM
SFT
RLHF
DPO
Multi-Agent

AI 估算 · 8k–12k

Agent前沿方向,技术难度高,米哈游平台大,实习薪资竞争力强

职位详情

关于这个职位

该职位专注于游戏AI智能体(Agent)的研发,包括AI NPC、对话系统、任务规划等核心能力,涉及大模型、强化学习等前沿技术

你将参与Agent架构设计、模型训练与对齐优化,以及记忆系统、工具调用等模块建设,为米哈游的AI原生游戏场景提供技术支持
适合对AI和游戏有浓厚兴趣的在校生

最低要求

)硕士及以上学历,计算机科学、人工智能、机器学习、自然语言处理、数据科学或相关专业,优秀本科生亦可

对大模型、Agent、强化学习、对话系统或游戏 AI 方向有浓厚兴趣,具备相关科研、实习或项目经验
)熟悉 Transformer 等基础模型原理,了解 LLM / VLM / 多模态模型及其在推理、规划、记忆、工具调用等方向的典型应用
)熟练使用 Python,具备良好的代码能力与算法基础,熟悉 PyTorch 及常用深度学习开发流程
)了解 SFT、DPO、RLHF、RLAIF、PPO、GRPO 等大模型对齐或强化学习方法中的一种或多种,有实际项目经验者优先
)了解 Agent 常见技术范式,如 ReAct、Function Calling、RAG、Memory、Planning、Multi-Agent 等,有相关项目、论文复现或开源实践者优先
)具备良好的学习能力、问题分析能力与团队协作能力,能够快速跟进前沿技术并完成实验验证与工程实现

工作职责

)Agent 能力研发:参与 AI Native 游戏场景下智能体(Agent)核心能力研发,覆盖智能 AI NPC、AI 叙事、AI 玩法等方向,探索多轮对话、任务规划、工具调用、环境交互、长期记忆与自主决策等能力建设

)Agent 架构实现:参与游戏场景下 Agent 核心模块的设计与开发,包括 Planning、Memory、Tool Use、Action、Reflection、Persona、State Tracking 等,协助提升智能体在复杂动态环境中的稳定性、一致性与可控性
)训练与对齐优化:参与 Agent 相关模型与策略优化工作,包括 SFT、DPO、RLHF/RLAIF、PPO/GRPO 等方法的实现、复现与改进,提升智能体在角色扮演、剧情推进、任务执行等场景中的效果
)记忆与数据建设:参与适用于游戏场景的 Agent Memory 体系和数据闭环建设,支持 NPC 对玩家行为、剧情进展、任务状态和角色关系等信息的记忆、检索与应用
)工具调用与评测体系:参与 Agent 工具调用链路、环境交互机制及评测体系建设,围绕任务完成、角色一致性、叙事合理性、工具调用效果、安全性等维度进行实验与分析
)前沿方向探索:跟踪 Agent、Multi-Agent、GUI Agent、Browser Agent、World Model、MCP、Agent Eval 等前沿技术进展,结合游戏业务进行技术预研、方案验证与创新尝试

优先资格

)有智能 NPC、角色扮演、开放域对话、交互叙事、AI 游戏玩法等相关项目或实习经历

)有 Agent、强化学习、对话系统、多模态、游戏 AI 等方向的科研经历,在相关会议或期刊发表论文者优先
)有 Code Agent、GUI Agent、Browser Agent、Computer Use、Multi-Agent 等方向的项目经验
)熟悉向量检索、RAG、长期记忆系统、Eval、自动化测试等相关技术
)有开源项目贡献、算法竞赛成绩或较强的工程实践能力
)热爱游戏,对游戏角色、剧情、玩法和玩家体验有理解者优先

AI 洞察

优缺点分析

优点

  • 接触前沿Agent技术,涉及LLM、RL、多模态等热点方向
  • 米哈游平台大,游戏AI需求明确,落地场景丰富
  • 团队氛围技术导向,有论文发表和开源贡献机会
  • 实习经历含金量高,对后续求职和职业发展助力大
  • 技术栈深度广,需要快速学习并掌握多种新概念
  • 实习岗位竞争激烈,需有较强的项目经验或科研成果
  • 适合对AI和游戏有热情、具备扎实机器学习基础、渴望在Agent前沿领域积累经验的在校生

缺点 / 挑战

  • 游戏AI对效果要求高,面临稳定性与一致性的技术挑战

角色解读

  • 从实习生成长为Agent算法工程师,主导游戏AI核心模块开发
  • 深入大模型对齐与强化学习领域,成为AI研究员或技术专家
  • 向技术管理方向转型,带领团队探索下一代游戏AI技术
  • 研发游戏AI智能体,包括AI NPC、对话系统和任务规划
  • 设计并实现Agent核心模块,如记忆、工具调用和决策规划
  • 优化模型对齐策略,提升智能体在角色扮演和剧情推进中的表现
  • 构建数据闭环和评测体系,确保智能体的稳定性和可控性
  • 扎实的机器学习基础,熟悉Transformer和LLM原理
  • 精通Python和PyTorch,具备深度学习开发经验
  • 了解Agent技术范式(ReAct、RAG、Memory等)和强化学习方法(PPO、DPO等)
  • 良好的问题分析与工程实现能力

申请策略

  • 提前了解米哈游的游戏产品(如原神、崩坏系列)和AI应用方向
  • 在简历中展示对游戏和AI结合的兴趣,可附上个人Demo或项目链接
  • 突出Agent或对话系统的项目经历,包括模型设计、训练和部署
  • 强调强化学习或对齐方法的实践经验,如PPO、DPO
  • 展示Python和PyTorch的代码能力,可提供GitHub链接
  • 如有游戏相关项目或论文,务必重点描述
  • 补充Agent技术栈知识,如ReAct、RAG、Memory系统
  • 熟练使用Hugging Face Transformers库,动手复现经典论文

面试指南

  • 对于算法原理类问题,先解释核心概念,再结合项目经验说明应用场景
  • 对于设计类问题,明确需求、给出方案、分析利弊
  • 对于评估类问题,从多个维度(任务完成、一致性、用户反馈)提出指标
  • 请解释Transformer的注意力机制,并说明其在LLM中的应用
  • RLHF的流程是什么?你在项目中如何实现PPO?
  • 设计一个游戏NPC的对话系统,考虑记忆和长期交互
  • Agent中ReAct模式与Function Calling的区别是什么?
  • 如何评估一个AI角色扮演的好坏?

匹配度报告

69
综合匹配度

米哈游Agent算法实习,前沿技术栈,高成长性,现场办公有一定强度。

适合人群
适合追求技术成长和前沿探索的在校生,对薪资和WLB可适当妥协。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利60
成长发展95
工作生活50
使命价值70

薪资福利匹配

60中等

实习薪资处于市场中等水平,但米哈游福利较好(如餐饮补贴等),但JD未明确列出,整体补偿性一般。

薪资信号面议 (8K-12K/月)

成长发展匹配

95较高

该职位技术前沿,涉及Agent、LLM、RL等热点,且是核心研发岗位,成长空间极大。

技术前沿前沿/新兴技术
技术栈Agent、LLM、PyTorch、SFT、DPO、RLHF、RAG、Multi-Agent
业务类型ambiguous

工作生活匹配

50较低

要求现场办公,未提及WLB,游戏行业实习通常有一定强度,生活化满足度一般。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值匹配

70中等

游戏AI能带来创意价值和玩家体验提升,但社会影响力相对有限。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

米哈游 的其他在招职位

  • 战略投资研究员(科技方向)

    米哈游 · 上海市
    AI 估算 · 20k-40k
  • 战略投资研究员(科技方向)

    米哈游 · 上海市
    AI 估算 · 20k-30k
  • AI 模型评测专家 - 星布谷地

    米哈游 · 上海市
    AI 估算 · 30k-50k
  • 三视图原画(第三方编制)-星布谷地

    米哈游 · 上海市
    AI 估算 · 15k-25k
  • LLM Post-train 算法工程师 - 星布谷地

    米哈游 · 上海市
    AI 估算 · 35k-60k

相似职位推荐

  • 算法研究员

    中国平安 · 深圳市
    AI 估算 · 30k-50k
  • 拔尖计划-人工智能专家

    中国移动 · 上海市
    AI 估算 · 50k-80k
  • Intern_Inno Mgmt/创新管理实习生(AI 产品)

    奔驰 · 北京市
    AI 估算 · 3k-5k
  • 伐谋产品组_R&D Pioneer 计划算法实习生(J100093)

    百度 · 北京市
    AI 估算 · 4k-8k
  • 计算机视觉及多模态算法实习生(J100103)

    百度 · 成都市
    AI 估算 · 4k-6k

米哈游 的其他在招职位

  • 战略投资研究员(科技方向)

    米哈游 · 上海市
    AI 估算 · 20k-40k
  • 战略投资研究员(科技方向)

    米哈游 · 上海市
    AI 估算 · 20k-30k
  • AI 模型评测专家 - 星布谷地

    米哈游 · 上海市
    AI 估算 · 30k-50k
  • 三视图原画(第三方编制)-星布谷地

    米哈游 · 上海市
    AI 估算 · 15k-25k
  • LLM Post-train 算法工程师 - 星布谷地

    米哈游 · 上海市
    AI 估算 · 35k-60k

相似职位推荐

  • 算法研究员

    中国平安 · 深圳市
    AI 估算 · 30k-50k
  • 拔尖计划-人工智能专家

    中国移动 · 上海市
    AI 估算 · 50k-80k
  • Intern_Inno Mgmt/创新管理实习生(AI 产品)

    奔驰 · 北京市
    AI 估算 · 3k-5k
  • 伐谋产品组_R&D Pioneer 计划算法实习生(J100093)

    百度 · 北京市
    AI 估算 · 4k-8k
  • 计算机视觉及多模态算法实习生(J100103)

    百度 · 成都市
    AI 估算 · 4k-6k