Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

miHoYo logo
米哈游
Agent 算法工程师 - Varsapura
立即应聘

Agent 算法工程师 - Varsapura

发布于 20 天前

普通员工/个人贡献者

上海市
中级经验
全职员工
仅现场办公
硕士
软件工程
NLP
PyTorch
强化学习
RAG
LLM
DeepSpeed
RLHF
游戏AI
Multi-Agent

AI 估算 · 40k–70k

米哈游为超大型游戏公司,Agent算法工程师属于前沿高薪岗位,结合硕博学历要求和上海水平,月薪4-7万合理。

职位详情

关于这个职位

你将成为米哈游AI Native游戏场景的核心算法工程师,负责研发与优化智能Agent系统,包括AI NPC、AI叙事与AI玩法

你将设计Agent核心架构,涉及记忆、规划、工具调用等模块,并应用SFT、RLHF等对齐技术提升智能体表现
这是一个前沿技术落地与游戏创新结合的高价值岗位

最低要求

)硕士及以上学历,计算机科学、人工智能、机器学习、自然语言处理或相关专业

)2年以上大模型应用、Agent系统、NLP算法或强化学习相关经验,有完整项目研发和落地经验
)熟悉LLM/VLM/多模态模型的基础原理及应用方式,理解Agent系统中的规划、记忆、工具调用、上下文管理与多步推理等关键问题
)熟练使用PyTorch及主流大模型训练/推理框架与工具链,如Transformers、DeepSpeed、Megatron-LM、VeRL、vLLM、SGLang等,具备较强的工程实现能力
)具备Agent方向的实际研发经验,熟悉ReAct、Function Calling、RAG、Memory、Reflection、Planning、Multi-Agent等常见范式,能够独立设计并实现复杂Agent工作流
)具备扎实的强化学习或对齐基础,理解SFT、DPO、RLHF、RLAIF、PPO、GRPO等方法原理,有将相关方法应用于大模型行为优化或Agent系统优化的实践经验
)具备良好的系统设计与问题分析能力,能够定位复杂系统中的效果、稳定性、延迟、成本和可观测性问题,并推动持续优化

工作职责

)Agent能力研发:面向AI Native游戏场景,负责智能体(Agent)核心能力研发与优化,覆盖智能AI NPC、AI叙事、AI玩法等方向,构建具备多轮对话、任务规划、工具调用、环境交互、长期记忆与自主决策能力的Agent系统

)Agent架构设计:设计并实现游戏场景下的Agent核心架构,包括Planning、Memory、Tool Use、Action、Reflection、Persona、State Tracking等模块,提升智能体在复杂动态环境中的稳定性、一致性与可控性
)训练与对齐优化:结合业务需求,参与Agent相关模型与策略优化,包括SFT、DPO、RLHF/RLAIF、PPO/GRPO等方法,提升智能体在角色一致性、任务完成率、对话连贯性、行为合理性和安全性等维度的表现
)记忆与数据体系建设:构建适用于游戏场景的Agent Memory与数据闭环体系,支持NPC对玩家历史行为、剧情进展、任务状态、角色关系和世界知识的长期记忆与高效调用,并持续优化训练数据与交互数据质量
)工具调用与环境交互:建设Agent的工具与动作能力,使其能够可靠调用游戏内外部系统能力,如任务系统、剧情系统、检索系统、脚本/代码执行、UI/Browser自动化等,提升Agent在真实业务场景中的执行能力
)评测体系与系统优化:建立面向Agent的评测体系,围绕任务完成、角色设定一致性、叙事合理性、工具调用成功率、长期记忆效果、安全性等维度设计Eval、自动化测试与分析机制,推动模型与系统持续迭代
)多Agent与前沿探索:探索Multi-Agent、GUI Agent、Browser Agent、World Model、MCP等前沿方向在游戏中的应用,与产品、策划、工程团队协同推进Agent能力的落地与创新

优先资格

)有智能NPC、角色扮演、开放域对话、AI叙事、AI玩法、沙盒模拟等相关项目经验

)有Code Agent、GUI Agent、Browser Agent、Computer Use、Multi-Agent、World Model等方向的研究或落地经验
)熟悉Agent Infrastructure相关能力建设,理解Compute & Sandbox、Memory、Tools & Actions、Model Routing、Orchestration、Observability & Governance等核心模块
)有Eval、Reward Modeling、偏好学习、长期记忆系统、RAG、向量检索、事件流建模等经验
)有游戏行业经验,理解角色设定、剧情逻辑、任务系统、世界观一致性等对Agent设计与训练的影响
)在ACL、EMNLP、NeurIPS、ICLR、ICML、AAAI等顶级会议发表过相关论文,或有高质量开源项目贡献

AI 洞察

优缺点分析

优点

  • 全面接触Agent全栈技术(训练、推理、对齐、系统),技能积累速度快
  • 公司资金充裕,不依赖融资,项目稳定性高,福利待遇优厚
  • Agent在开放域游戏场景下落地难度大,需处理复杂动态环境和一致性要求
  • 技术栈跨度大,同时需要算法和工程能力,对综合能力要求高

缺点 / 挑战

  • 米哈游是游戏行业顶尖公司,AI Native游戏是前沿方向,技术挑战与成就感兼具
  • 互联网/游戏行业节奏快,可能面临高强度工作与迭代压力
  • 适合在NLP/强化学习领域有深厚积累,热爱游戏与AI交叉,追求技术前沿和挑战的算法工程师

角色解读

  • 在Agent算法方向深耕,成为智能体领域的专家,主导核心架构设计与技术决策
  • 横向扩展至多模态、World Model等前沿方向,参与AI原生游戏的整体技术规划
  • 晋升技术管理路线,带领算法团队,或转向产品/策划协同岗位推动AI落地
  • 研发AI Native游戏中的智能体(Agent),构建具备多轮对话、任务规划、长期记忆的AI NPC系统
  • 设计并实现Agent核心架构,包括规划、记忆、工具调用、反射等模块,确保在动态游戏中稳定可控
  • 应用SFT、RLHF等对齐方法优化模型在角色一致性、任务完成率等方面的表现
  • 建立评测体系和数据闭环,持续迭代Agent能力,并探索Multi-Agent、World Model等前沿方向
  • 扎实的LLM/VLM基础,熟悉Transformer架构及大模型训练/推理框架(PyTorch, DeepSpeed等)
  • 丰富的Agent系统开发经验,掌握ReAct、Function Calling、RAG、Multi-Agent等范式
  • 强化学习与对齐方法(PPO, DPO, RLHF)的实践经验,能独立优化模型行为
  • 良好的工程实现能力,能解决系统稳定性、延迟、成本等实际问题

申请策略

  • 研究米哈游旗下游戏(如原神、崩坏系列)的AI应用,思考如何改进
  • 在面试中展示对AI Native游戏的理解,提出创新想法
  • 突出Agent相关项目经验,详细描述在规划、记忆、工具调用等方面的具体贡献
  • 强调强化学习或对齐方法(SFT, RLHF等)的实际应用成果,最好有量化指标
  • 展示工程能力:使用过的框架、优化过的系统延迟/成本等
  • 若有游戏相关项目或顶级论文,务必突出
  • 补充游戏行业知识,了解角色设定、剧情逻辑等对Agent设计的影响
  • 熟悉Agent基础设施如Compute & Sandbox、Observability等模块

面试指南

  • STAR法则:描述场景、任务、行动和结果,突出技术选型与量化效果
  • 八股+实践:先阐述理论原理,再结合项目经验说明具体实现和优化
  • 对比分析:给出多种方案的优缺点,展现系统思维
  • 如何设计一个具有长期记忆的AI NPC系统?
  • 谈谈你在项目中如何使用RLHF优化模型行为,遇到过哪些挑战?
  • 多Agent系统中如何协调角色行为并保证一致性?
  • 如何构建Agent的评测体系,确保任务完成和角色设定相符?
  • 请描述一个你独立实现复杂Agent工作流的案例

匹配度报告

70
综合匹配度

米哈游AI Agent岗位,技术前沿、薪资优厚,但工作地点固定、节奏可能较快。

适合人群
该职位最适合追求技术成长、渴望在AI前沿领域积累经验的求职者,对WLB要求不高且能接受高强度工作。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利80
成长发展90
工作生活40
使命价值70

薪资福利匹配

80较高

米哈游作为超大型游戏公司,薪资水平位于行业顶端,福利完善,但JD未明确披露薪资和具体福利,故评分为较高但非满分。

薪资信号未披露(AI估算:40K-70K/月)

成长发展匹配

90较高

该岗位全面覆盖Agent前沿技术(LLM、RLHF、Multi-Agent等),涉及从研究到工程的全链路,成长空间极大,且公司技术氛围浓厚。

技术前沿前沿/新兴技术
技术栈LLM、Agent、RLHF、Multi-Agent、World Model、RAG、DeepSpeed
业务类型profit_center

工作生活匹配

40较低

仅现场办公,未提及弹性或远程。游戏行业通常节奏较快,但JD无明确WLB信号,暂按中等偏下评估。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值匹配

70中等

AI Native游戏是新兴高增长方向,推动技术娱乐化有一定社会意义。但游戏行业的社会影响力相对中性,且JD无明确使命导向词汇。

行业发展高速增长赛道
社会影响中性/一般
创新程度开拓性创新(行业首创)
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

米哈游 的其他在招职位

  • 内容运营-素材(第三方编制)

    米哈游 · 上海市
    AI 估算 · 10k-20k
  • AI服务DevOps工程师

    米哈游 · 上海市
    AI 估算 · 25k-45k
  • 系统策划-星布谷地

    米哈游 · 上海市
    AI 估算 · 20k-30k
  • 渠道商务

    米哈游 · 上海市
    AI 估算 · 20k-40k
  • 游戏项目管理(AI产品方向)

    米哈游 · 上海市
    AI 估算 · 20k-35k

相似职位推荐

  • 试验数字化系统开发工程师-2027届

    小米 · 上海市
    AI 估算 · 15k-25k
  • 魔方工作室-UE流程工具开发TA

    腾讯 · 深圳市
    AI 估算 · 25k-45k
  • 游戏客户端开发-新项目

    叠纸游戏 · 上海市
    AI 估算 · 15k-25k
  • 技术策划--3d方向

    网易 · 上海市
    AI 估算 · 30k-50k
  • 架构师(证券业务)

    东方财富 · 上海市
    AI 估算 · 30k-60k

米哈游 的其他在招职位

  • 内容运营-素材(第三方编制)

    米哈游 · 上海市
    AI 估算 · 10k-20k
  • AI服务DevOps工程师

    米哈游 · 上海市
    AI 估算 · 25k-45k
  • 系统策划-星布谷地

    米哈游 · 上海市
    AI 估算 · 20k-30k
  • 渠道商务

    米哈游 · 上海市
    AI 估算 · 20k-40k
  • 游戏项目管理(AI产品方向)

    米哈游 · 上海市
    AI 估算 · 20k-35k

相似职位推荐

  • 试验数字化系统开发工程师-2027届

    小米 · 上海市
    AI 估算 · 15k-25k
  • 魔方工作室-UE流程工具开发TA

    腾讯 · 深圳市
    AI 估算 · 25k-45k
  • 游戏客户端开发-新项目

    叠纸游戏 · 上海市
    AI 估算 · 15k-25k
  • 技术策划--3d方向

    网易 · 上海市
    AI 估算 · 30k-50k
  • 架构师(证券业务)

    东方财富 · 上海市
    AI 估算 · 30k-60k