米哈游的Agent 算法工程师 - Varsapura薪资是多少？

该职位薪资范围为 40k–70k（人民币/月）。

Agent 算法工程师 - Varsapura的工作地点在哪里？

该职位工作地点位于上海市。工作形式为仅现场办公。

米哈游的Agent 算法工程师 - Varsapura有什么任职要求？

该职位要求硕士学历及中级经验工作经验。

米哈游

Agent 算法工程师 - Varsapura

立即应聘

Agent 算法工程师 - Varsapura

发布于 20 天前

普通员工/个人贡献者

上海市

中级经验

全职员工

仅现场办公

硕士

软件工程

NLP

PyTorch

强化学习

RAG

LLM

DeepSpeed

RLHF

游戏AI

Multi-Agent

AI 估算 · 40k–70k

米哈游为超大型游戏公司，Agent算法工程师属于前沿高薪岗位，结合硕博学历要求和上海水平，月薪4-7万合理。

职位详情

关于这个职位

你将成为米哈游AI Native游戏场景的核心算法工程师，负责研发与优化智能Agent系统，包括AI NPC、AI叙事与AI玩法

你将设计Agent核心架构，涉及记忆、规划、工具调用等模块，并应用SFT、RLHF等对齐技术提升智能体表现

这是一个前沿技术落地与游戏创新结合的高价值岗位

最低要求

）硕士及以上学历，计算机科学、人工智能、机器学习、自然语言处理或相关专业

）2年以上大模型应用、Agent系统、NLP算法或强化学习相关经验，有完整项目研发和落地经验

）熟悉LLM/VLM/多模态模型的基础原理及应用方式，理解Agent系统中的规划、记忆、工具调用、上下文管理与多步推理等关键问题

）熟练使用PyTorch及主流大模型训练/推理框架与工具链，如Transformers、DeepSpeed、Megatron-LM、VeRL、vLLM、SGLang等，具备较强的工程实现能力

）具备Agent方向的实际研发经验，熟悉ReAct、Function Calling、RAG、Memory、Reflection、Planning、Multi-Agent等常见范式，能够独立设计并实现复杂Agent工作流

）具备扎实的强化学习或对齐基础，理解SFT、DPO、RLHF、RLAIF、PPO、GRPO等方法原理，有将相关方法应用于大模型行为优化或Agent系统优化的实践经验

）具备良好的系统设计与问题分析能力，能够定位复杂系统中的效果、稳定性、延迟、成本和可观测性问题，并推动持续优化

工作职责

）Agent能力研发：面向AI Native游戏场景，负责智能体（Agent）核心能力研发与优化，覆盖智能AI NPC、AI叙事、AI玩法等方向，构建具备多轮对话、任务规划、工具调用、环境交互、长期记忆与自主决策能力的Agent系统

）Agent架构设计：设计并实现游戏场景下的Agent核心架构，包括Planning、Memory、Tool Use、Action、Reflection、Persona、State Tracking等模块，提升智能体在复杂动态环境中的稳定性、一致性与可控性

）训练与对齐优化：结合业务需求，参与Agent相关模型与策略优化，包括SFT、DPO、RLHF/RLAIF、PPO/GRPO等方法，提升智能体在角色一致性、任务完成率、对话连贯性、行为合理性和安全性等维度的表现

）记忆与数据体系建设：构建适用于游戏场景的Agent Memory与数据闭环体系，支持NPC对玩家历史行为、剧情进展、任务状态、角色关系和世界知识的长期记忆与高效调用，并持续优化训练数据与交互数据质量

）工具调用与环境交互：建设Agent的工具与动作能力，使其能够可靠调用游戏内外部系统能力，如任务系统、剧情系统、检索系统、脚本/代码执行、UI/Browser自动化等，提升Agent在真实业务场景中的执行能力

）评测体系与系统优化：建立面向Agent的评测体系，围绕任务完成、角色设定一致性、叙事合理性、工具调用成功率、长期记忆效果、安全性等维度设计Eval、自动化测试与分析机制，推动模型与系统持续迭代

）多Agent与前沿探索：探索Multi-Agent、GUI Agent、Browser Agent、World Model、MCP等前沿方向在游戏中的应用，与产品、策划、工程团队协同推进Agent能力的落地与创新

优先资格

）有智能NPC、角色扮演、开放域对话、AI叙事、AI玩法、沙盒模拟等相关项目经验

）有Code Agent、GUI Agent、Browser Agent、Computer Use、Multi-Agent、World Model等方向的研究或落地经验

）熟悉Agent Infrastructure相关能力建设，理解Compute & Sandbox、Memory、Tools & Actions、Model Routing、Orchestration、Observability & Governance等核心模块

）有Eval、Reward Modeling、偏好学习、长期记忆系统、RAG、向量检索、事件流建模等经验

）有游戏行业经验，理解角色设定、剧情逻辑、任务系统、世界观一致性等对Agent设计与训练的影响

）在ACL、EMNLP、NeurIPS、ICLR、ICML、AAAI等顶级会议发表过相关论文，或有高质量开源项目贡献

AI 洞察

优缺点分析

优点

全面接触Agent全栈技术（训练、推理、对齐、系统），技能积累速度快
公司资金充裕，不依赖融资，项目稳定性高，福利待遇优厚
Agent在开放域游戏场景下落地难度大，需处理复杂动态环境和一致性要求
技术栈跨度大，同时需要算法和工程能力，对综合能力要求高

缺点 / 挑战

米哈游是游戏行业顶尖公司，AI Native游戏是前沿方向，技术挑战与成就感兼具
互联网/游戏行业节奏快，可能面临高强度工作与迭代压力
适合在NLP/强化学习领域有深厚积累，热爱游戏与AI交叉，追求技术前沿和挑战的算法工程师

角色解读

在Agent算法方向深耕，成为智能体领域的专家，主导核心架构设计与技术决策
横向扩展至多模态、World Model等前沿方向，参与AI原生游戏的整体技术规划
晋升技术管理路线，带领算法团队，或转向产品/策划协同岗位推动AI落地
研发AI Native游戏中的智能体（Agent），构建具备多轮对话、任务规划、长期记忆的AI NPC系统
设计并实现Agent核心架构，包括规划、记忆、工具调用、反射等模块，确保在动态游戏中稳定可控
应用SFT、RLHF等对齐方法优化模型在角色一致性、任务完成率等方面的表现
建立评测体系和数据闭环，持续迭代Agent能力，并探索Multi-Agent、World Model等前沿方向
扎实的LLM/VLM基础，熟悉Transformer架构及大模型训练/推理框架（PyTorch, DeepSpeed等）
丰富的Agent系统开发经验，掌握ReAct、Function Calling、RAG、Multi-Agent等范式
强化学习与对齐方法（PPO, DPO, RLHF）的实践经验，能独立优化模型行为
良好的工程实现能力，能解决系统稳定性、延迟、成本等实际问题

申请策略

研究米哈游旗下游戏（如原神、崩坏系列）的AI应用，思考如何改进
在面试中展示对AI Native游戏的理解，提出创新想法
突出Agent相关项目经验，详细描述在规划、记忆、工具调用等方面的具体贡献
强调强化学习或对齐方法（SFT, RLHF等）的实际应用成果，最好有量化指标
展示工程能力：使用过的框架、优化过的系统延迟/成本等
若有游戏相关项目或顶级论文，务必突出
补充游戏行业知识，了解角色设定、剧情逻辑等对Agent设计的影响
熟悉Agent基础设施如Compute & Sandbox、Observability等模块

面试指南

STAR法则：描述场景、任务、行动和结果，突出技术选型与量化效果
八股+实践：先阐述理论原理，再结合项目经验说明具体实现和优化
对比分析：给出多种方案的优缺点，展现系统思维
如何设计一个具有长期记忆的AI NPC系统？
谈谈你在项目中如何使用RLHF优化模型行为，遇到过哪些挑战？
多Agent系统中如何协调角色行为并保证一致性？
如何构建Agent的评测体系，确保任务完成和角色设定相符？
请描述一个你独立实现复杂Agent工作流的案例

匹配度报告

综合匹配度

米哈游AI Agent岗位，技术前沿、薪资优厚，但工作地点固定、节奏可能较快。

适合人群

该职位最适合追求技术成长、渴望在AI前沿领域积累经验的求职者，对WLB要求不高且能接受高强度工作。

最强匹配

成长发展匹配

最弱匹配

工作生活匹配

薪资福利80

成长发展90

工作生活40

使命价值70

薪资福利匹配

80较高

米哈游作为超大型游戏公司，薪资水平位于行业顶端，福利完善，但JD未明确披露薪资和具体福利，故评分为较高但非满分。

薪资信号未披露（AI估算：40K-70K/月）

成长发展匹配

90较高

该岗位全面覆盖Agent前沿技术（LLM、RLHF、Multi-Agent等），涉及从研究到工程的全链路，成长空间极大，且公司技术氛围浓厚。

技术前沿前沿/新兴技术

技术栈LLM、Agent、RLHF、Multi-Agent、World Model、RAG、DeepSpeed

业务类型profit_center

工作生活匹配

40较低

仅现场办公，未提及弹性或远程。游戏行业通常节奏较快，但JD无明确WLB信号，暂按中等偏下评估。

工作模式仅现场办公

办公地点未明确

加班情况未提及（无法判断）

使命价值匹配

70中等

AI Native游戏是新兴高增长方向，推动技术娱乐化有一定社会意义。但游戏行业的社会影响力相对中性，且JD无明确使命导向词汇。

行业发展高速增长赛道

社会影响中性/一般

创新程度开拓性创新（行业首创）

Watch Jobs

米哈游

Agent 算法工程师 - Varsapura

立即应聘

Agent 算法工程师 - Varsapura

发布于 20 天前

普通员工/个人贡献者

上海市

中级经验

全职员工

仅现场办公

硕士

软件工程

NLP

PyTorch

强化学习

RAG

LLM

DeepSpeed

RLHF

游戏AI

Multi-Agent

AI 估算 · 40k–70k

米哈游为超大型游戏公司，Agent算法工程师属于前沿高薪岗位，结合硕博学历要求和上海水平，月薪4-7万合理。