米哈游的Agent 算法研究员薪资是多少？

该职位薪资范围为 8k–12k（人民币/月）。

Agent 算法研究员的工作地点在哪里？

该职位工作地点位于上海市。工作形式为仅现场办公。

米哈游的Agent 算法研究员有什么任职要求？

该职位要求硕士学历及无经验要求工作经验。

米哈游

Agent 算法研究员

立即应聘

Agent 算法研究员

发布于大约 2 个月前

实习/见习

上海市

无经验要求

实习生

仅现场办公

硕士

研究与开发 (研发)

PyTorch

RAG

LLM

SFT

RLHF

DPO

Multi-Agent

AI 估算 · 8k–12k

Agent前沿方向，技术难度高，米哈游平台大，实习薪资竞争力强

职位详情

关于这个职位

该职位专注于游戏AI智能体（Agent）的研发，包括AI NPC、对话系统、任务规划等核心能力，涉及大模型、强化学习等前沿技术

你将参与Agent架构设计、模型训练与对齐优化，以及记忆系统、工具调用等模块建设，为米哈游的AI原生游戏场景提供技术支持

适合对AI和游戏有浓厚兴趣的在校生

最低要求

）硕士及以上学历，计算机科学、人工智能、机器学习、自然语言处理、数据科学或相关专业，优秀本科生亦可

对大模型、Agent、强化学习、对话系统或游戏 AI 方向有浓厚兴趣，具备相关科研、实习或项目经验

）熟悉 Transformer 等基础模型原理，了解 LLM / VLM / 多模态模型及其在推理、规划、记忆、工具调用等方向的典型应用

）熟练使用 Python，具备良好的代码能力与算法基础，熟悉 PyTorch 及常用深度学习开发流程

）了解 SFT、DPO、RLHF、RLAIF、PPO、GRPO 等大模型对齐或强化学习方法中的一种或多种，有实际项目经验者优先

）了解 Agent 常见技术范式，如 ReAct、Function Calling、RAG、Memory、Planning、Multi-Agent 等，有相关项目、论文复现或开源实践者优先

）具备良好的学习能力、问题分析能力与团队协作能力，能够快速跟进前沿技术并完成实验验证与工程实现

工作职责

）Agent 能力研发：参与 AI Native 游戏场景下智能体（Agent）核心能力研发，覆盖智能 AI NPC、AI 叙事、AI 玩法等方向，探索多轮对话、任务规划、工具调用、环境交互、长期记忆与自主决策等能力建设

）Agent 架构实现：参与游戏场景下 Agent 核心模块的设计与开发，包括 Planning、Memory、Tool Use、Action、Reflection、Persona、State Tracking 等，协助提升智能体在复杂动态环境中的稳定性、一致性与可控性

）训练与对齐优化：参与 Agent 相关模型与策略优化工作，包括 SFT、DPO、RLHF/RLAIF、PPO/GRPO 等方法的实现、复现与改进，提升智能体在角色扮演、剧情推进、任务执行等场景中的效果

）记忆与数据建设：参与适用于游戏场景的 Agent Memory 体系和数据闭环建设，支持 NPC 对玩家行为、剧情进展、任务状态和角色关系等信息的记忆、检索与应用

）工具调用与评测体系：参与 Agent 工具调用链路、环境交互机制及评测体系建设，围绕任务完成、角色一致性、叙事合理性、工具调用效果、安全性等维度进行实验与分析

）前沿方向探索：跟踪 Agent、Multi-Agent、GUI Agent、Browser Agent、World Model、MCP、Agent Eval 等前沿技术进展，结合游戏业务进行技术预研、方案验证与创新尝试

优先资格

）有智能 NPC、角色扮演、开放域对话、交互叙事、AI 游戏玩法等相关项目或实习经历

）有 Agent、强化学习、对话系统、多模态、游戏 AI 等方向的科研经历，在相关会议或期刊发表论文者优先

）有 Code Agent、GUI Agent、Browser Agent、Computer Use、Multi-Agent 等方向的项目经验

）熟悉向量检索、RAG、长期记忆系统、Eval、自动化测试等相关技术

）有开源项目贡献、算法竞赛成绩或较强的工程实践能力

）热爱游戏，对游戏角色、剧情、玩法和玩家体验有理解者优先

AI 洞察

优缺点分析

优点

接触前沿Agent技术，涉及LLM、RL、多模态等热点方向
米哈游平台大，游戏AI需求明确，落地场景丰富
团队氛围技术导向，有论文发表和开源贡献机会
实习经历含金量高，对后续求职和职业发展助力大
技术栈深度广，需要快速学习并掌握多种新概念
实习岗位竞争激烈，需有较强的项目经验或科研成果
适合对AI和游戏有热情、具备扎实机器学习基础、渴望在Agent前沿领域积累经验的在校生

缺点 / 挑战

游戏AI对效果要求高，面临稳定性与一致性的技术挑战

角色解读

从实习生成长为Agent算法工程师，主导游戏AI核心模块开发
深入大模型对齐与强化学习领域，成为AI研究员或技术专家
向技术管理方向转型，带领团队探索下一代游戏AI技术
研发游戏AI智能体，包括AI NPC、对话系统和任务规划
设计并实现Agent核心模块，如记忆、工具调用和决策规划
优化模型对齐策略，提升智能体在角色扮演和剧情推进中的表现
构建数据闭环和评测体系，确保智能体的稳定性和可控性
扎实的机器学习基础，熟悉Transformer和LLM原理
精通Python和PyTorch，具备深度学习开发经验
了解Agent技术范式（ReAct、RAG、Memory等）和强化学习方法（PPO、DPO等）
良好的问题分析与工程实现能力

申请策略

提前了解米哈游的游戏产品（如原神、崩坏系列）和AI应用方向
在简历中展示对游戏和AI结合的兴趣，可附上个人Demo或项目链接
突出Agent或对话系统的项目经历，包括模型设计、训练和部署
强调强化学习或对齐方法的实践经验，如PPO、DPO
展示Python和PyTorch的代码能力，可提供GitHub链接
如有游戏相关项目或论文，务必重点描述
补充Agent技术栈知识，如ReAct、RAG、Memory系统
熟练使用Hugging Face Transformers库，动手复现经典论文

面试指南

对于算法原理类问题，先解释核心概念，再结合项目经验说明应用场景
对于设计类问题，明确需求、给出方案、分析利弊
对于评估类问题，从多个维度（任务完成、一致性、用户反馈）提出指标
请解释Transformer的注意力机制，并说明其在LLM中的应用
RLHF的流程是什么？你在项目中如何实现PPO？
设计一个游戏NPC的对话系统，考虑记忆和长期交互
Agent中ReAct模式与Function Calling的区别是什么？
如何评估一个AI角色扮演的好坏？

职位点评

综合评分

米哈游Agent算法实习，前沿技术栈，高成长性，现场办公有一定强度。

更适合这类人

适合追求技术成长和前沿探索的在校生，对薪资和WLB可适当妥协。

表现最好

成长发展

相对薄弱

工作生活

薪资福利60

成长发展95

工作生活50

使命价值70

薪资福利

60中等

实习薪资处于市场中等水平，但米哈游福利较好（如餐饮补贴等），但JD未明确列出，整体补偿性一般。

薪资信号面议 (8K-12K/月)

成长发展

95较高

该职位技术前沿，涉及Agent、LLM、RL等热点，且是核心研发岗位，成长空间极大。

技术前沿前沿/新兴技术

技术栈Agent、LLM、PyTorch、SFT、DPO、RLHF、RAG、Multi-Agent

业务类型ambiguous

工作生活

50较低

要求现场办公，未提及WLB，游戏行业实习通常有一定强度，生活化满足度一般。

工作模式仅现场办公

办公地点未明确

加班情况未提及（无法判断）

使命价值

70中等

游戏AI能带来创意价值和玩家体验提升，但社会影响力相对有限。

行业发展高速增长赛道

社会影响中性/一般

创新程度积极采用新技术

Watch Jobs

米哈游

Agent 算法研究员

立即应聘

Agent 算法研究员

发布于大约 2 个月前

实习/见习

上海市

无经验要求

实习生

仅现场办公

硕士

研究与开发 (研发)

PyTorch

RAG

LLM

SFT

RLHF

DPO

Multi-Agent

AI 估算 · 8k–12k

Agent前沿方向，技术难度高，米哈游平台大，实习薪资竞争力强

职位详情

关于这个职位

该职位专注于游戏AI智能体（Agent）的研发，包括AI NPC、对话系统、任务规划等核心能力，涉及大模型、强化学习等前沿技术

你将参与Agent架构设计、模型训练与对齐优化，以及记忆系统、工具调用等模块建设，为米哈游的AI原生游戏场景提供技术支持

适合对AI和游戏有浓厚兴趣的在校生

最低要求

）硕士及以上学历，计算机科学、人工智能、机器学习、自然语言处理、数据科学或相关专业，优秀本科生亦可

对大模型、Agent、强化学习、对话系统或游戏 AI 方向有浓厚兴趣，具备相关科研、实习或项目经验

）熟悉 Transformer 等基础模型原理，了解 LLM / VLM / 多模态模型及其在推理、规划、记忆、工具调用等方向的典型应用

）熟练使用 Python，具备良好的代码能力与算法基础，熟悉 PyTorch 及常用深度学习开发流程

）了解 SFT、DPO、RLHF、RLAIF、PPO、GRPO 等大模型对齐或强化学习方法中的一种或多种，有实际项目经验者优先

）了解 Agent 常见技术范式，如 ReAct、Function Calling、RAG、Memory、Planning、Multi-Agent 等，有相关项目、论文复现或开源实践者优先

）具备良好的学习能力、问题分析能力与团队协作能力，能够快速跟进前沿技术并完成实验验证与工程实现

工作职责

优先资格

）有智能 NPC、角色扮演、开放域对话、交互叙事、AI 游戏玩法等相关项目或实习经历

）有 Agent、强化学习、对话系统、多模态、游戏 AI 等方向的科研经历，在相关会议或期刊发表论文者优先

）有 Code Agent、GUI Agent、Browser Agent、Computer Use、Multi-Agent 等方向的项目经验

）熟悉向量检索、RAG、长期记忆系统、Eval、自动化测试等相关技术

）有开源项目贡献、算法竞赛成绩或较强的工程实践能力

）热爱游戏，对游戏角色、剧情、玩法和玩家体验有理解者优先

AI 洞察

优缺点分析

优点

接触前沿Agent技术，涉及LLM、RL、多模态等热点方向
米哈游平台大，游戏AI需求明确，落地场景丰富
团队氛围技术导向，有论文发表和开源贡献机会
实习经历含金量高，对后续求职和职业发展助力大
技术栈深度广，需要快速学习并掌握多种新概念
实习岗位竞争激烈，需有较强的项目经验或科研成果
适合对AI和游戏有热情、具备扎实机器学习基础、渴望在Agent前沿领域积累经验的在校生

缺点 / 挑战

游戏AI对效果要求高，面临稳定性与一致性的技术挑战

角色解读

从实习生成长为Agent算法工程师，主导游戏AI核心模块开发
深入大模型对齐与强化学习领域，成为AI研究员或技术专家
向技术管理方向转型，带领团队探索下一代游戏AI技术
研发游戏AI智能体，包括AI NPC、对话系统和任务规划
设计并实现Agent核心模块，如记忆、工具调用和决策规划
优化模型对齐策略，提升智能体在角色扮演和剧情推进中的表现
构建数据闭环和评测体系，确保智能体的稳定性和可控性
扎实的机器学习基础，熟悉Transformer和LLM原理
精通Python和PyTorch，具备深度学习开发经验
了解Agent技术范式（ReAct、RAG、Memory等）和强化学习方法（PPO、DPO等）
良好的问题分析与工程实现能力

申请策略

提前了解米哈游的游戏产品（如原神、崩坏系列）和AI应用方向
在简历中展示对游戏和AI结合的兴趣，可附上个人Demo或项目链接
突出Agent或对话系统的项目经历，包括模型设计、训练和部署
强调强化学习或对齐方法的实践经验，如PPO、DPO
展示Python和PyTorch的代码能力，可提供GitHub链接
如有游戏相关项目或论文，务必重点描述
补充Agent技术栈知识，如ReAct、RAG、Memory系统
熟练使用Hugging Face Transformers库，动手复现经典论文

面试指南

对于算法原理类问题，先解释核心概念，再结合项目经验说明应用场景
对于设计类问题，明确需求、给出方案、分析利弊
对于评估类问题，从多个维度（任务完成、一致性、用户反馈）提出指标
请解释Transformer的注意力机制，并说明其在LLM中的应用
RLHF的流程是什么？你在项目中如何实现PPO？
设计一个游戏NPC的对话系统，考虑记忆和长期交互
Agent中ReAct模式与Function Calling的区别是什么？
如何评估一个AI角色扮演的好坏？

职位点评

综合评分

米哈游Agent算法实习，前沿技术栈，高成长性，现场办公有一定强度。

更适合这类人

适合追求技术成长和前沿探索的在校生，对薪资和WLB可适当妥协。

表现最好

成长发展

相对薄弱

工作生活

薪资福利60

成长发展95

工作生活50

使命价值70

薪资福利

60中等

实习薪资处于市场中等水平，但米哈游福利较好（如餐饮补贴等），但JD未明确列出，整体补偿性一般。

薪资信号面议 (8K-12K/月)

成长发展

95较高

该职位技术前沿，涉及Agent、LLM、RL等热点，且是核心研发岗位，成长空间极大。

技术前沿前沿/新兴技术

技术栈Agent、LLM、PyTorch、SFT、DPO、RLHF、RAG、Multi-Agent

业务类型ambiguous

工作生活

50较低

要求现场办公，未提及WLB，游戏行业实习通常有一定强度，生活化满足度一般。

工作模式仅现场办公

办公地点未明确

加班情况未提及（无法判断）

使命价值

70中等

游戏AI能带来创意价值和玩家体验提升，但社会影响力相对有限。

行业发展高速增长赛道

社会影响中性/一般

创新程度积极采用新技术

Watch Jobs

Agent 算法研究员

职位详情

关于这个职位

最低要求

工作职责

优先资格

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

Agent 算法研究员

职位详情

关于这个职位

最低要求

工作职责

优先资格

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

米哈游 的其他在招职位

AI平台运营实习生

CG氛围设计-崩坏：因缘精灵

引擎开发（特效）- UE5动作预研（写实奇幻）

投放视频设计（第三方编制）

引擎开发-绝区零

相似职位推荐

StarMaker-推荐算法实习生

2050-Agent算法研究员

2050-算法研究员

StarMaker-语音算法实习生

Lamination & Gluing Engineer - Process

米哈游 的其他在招职位

AI平台运营实习生

CG氛围设计-崩坏：因缘精灵

引擎开发（特效）- UE5动作预研（写实奇幻）

投放视频设计（第三方编制）

引擎开发-绝区零

相似职位推荐

StarMaker-推荐算法实习生

2050-Agent算法研究员

2050-算法研究员

StarMaker-语音算法实习生

Lamination & Gluing Engineer - Process

米哈游的其他在招职位

米哈游的其他在招职位