Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

miHoYo logo
米哈游
AI研发工程师(RL)-UE5动作预研(写实奇幻)
立即应聘

AI研发工程师(RL)-UE5动作预研(写实奇幻)

发布于 大约 16 小时前

普通员工/个人贡献者

上海市
高级经验
全职员工
仅现场办公
硕士
研究与开发 (研发)
强化学习
仿真环境
LLM
算法优化
Unreal Engine
深度强化学习
游戏AI
奖励设计
多智能体强化学习

AI 估算 · 30k–60k

资深RL工程师,米哈游大厂16薪,上海AI岗位薪资较高,结合市场行情估算。

职位详情

关于这个职位

该职位专注于为米哈游的写实奇幻游戏(UE5引擎)开发智能NPC的强化学习算法,涵盖DRL决策、多智能体协作以及LLM与RL的混合架构

你将搭建训练环境、优化奖励机制,并负责模型在游戏引擎中的工程化落地
适合有3-5年RL工业经验、对游戏AI有热情的工程师

最低要求

计算机、数学、人工智能相关专业,硕士及以上学历,3-5年及以上强化学习相关工业界经验

有基于强化学习构建项目机器人的经验,有能力完成Bot在模型侧方案的设计,落地

工作职责

智能NPC行为研发:负责游戏/虚拟世界中智能NPC的强化学习算法模型设计,通过深度强化学习(DRL)使NPC具备自适应决策、复杂博弈与拟人化交互能力

训练框架与环境搭建:设计与优化大规模强化学习训练框架,构建高效的仿真训练环境(Simulation Environment)与奖励机制(Reward Shaping),加速策略收敛
前沿技术预研:探索多智能体强化学习(MARL)、大模型(LLM)与强化学习(RL)的结合应用(如LLM规划+RL执行的混合架构),打造高沉浸感的游戏生态
工程化落地:负责RL模型在现代游戏引擎(如Unity / Unreal Engine)中的部署、推理优化与性能调优

优先资格

有知名游戏项目(如开放世界、MOBA、RTS等)智能NPC或AI Bot开发上线经验者优先

熟悉大语言模型(LLM)、知识图谱在NPC行为和对话驱动中应用者优先

AI 洞察

优缺点分析

优点

  • 接触前沿技术(RL+LLM+游戏引擎),技术成长空间大
  • 米哈游平台资源丰富,项目影响力大,可参与顶级游戏开发
  • 团队技术氛围浓厚,能与优秀同事共同探索
  • 薪资待遇优厚,大厂福利完善
  • 游戏AI落地要求高,需兼顾性能与效果,调试难度大
  • 技术更新快,需要持续学习新技术

缺点 / 挑战

  • 项目周期可能紧张,需承受一定的工作压力
  • 适合对游戏AI有强烈兴趣、具备扎实RL功底且愿意挑战前沿技术的工程师

角色解读

  • 成为游戏AI领域的专家,主导NPC行为、战斗AI等核心模块
  • 向技术负责人或架构师方向发展,负责整体AI技术栈规划
  • 可跨领域探索通用AI或具身智能等前沿方向
  • 设计并训练强化学习模型,让游戏NPC具备拟人化的决策和交互能力
  • 搭建大规模训练框架和仿真环境,优化奖励机制加速策略收敛
  • 探索LLM+RL混合架构等前沿技术,提升游戏沉浸感
  • 将RL模型部署到UE5引擎中,进行推理优化和性能调优
  • 精通深度强化学习(DRL)算法,如PPO、SAC等,并有实际项目经验
  • 熟悉多智能体强化学习(MARL)和LLM相关知识
  • 具备扎实的编程能力(Python/C++),了解游戏引擎(Unreal/Unity)
  • 有大规模分布式训练框架搭建经验(如Ray、RLlib等)

申请策略

  • 研究米哈游现有游戏的AI特点,在面试中展示对游戏AI的见解
  • 关注职位描述中的“写实奇幻”风格,思考AI如何增强沉浸感
  • 突出强化学习项目经验,尤其是游戏/Bot/NPC相关落地案例
  • 展示分布式训练框架搭建和性能优化成果
  • 若有LLM或MARL经验,重点强调
  • 附上GitHub或技术博客链接,体现技术深度
  • 复习强化学习经典算法并动手实现,熟悉近期论文
  • 了解Unreal Engine的基本使用和蓝图系统

面试指南

  • STAR法则:描述情境、任务、行动、结果,突出技术难点和量化指标
  • 从问题本质出发,先分析需求再逐步展开方案,体现系统性思考
  • 结合最新论文或开源项目,展示对前沿技术的跟踪
  • 请介绍一个你主导的强化学习项目,包括问题定义、算法选择、落地效果
  • 如何设计奖励函数来鼓励NPC拟人化行为?
  • 你如何理解LLM与RL的结合?请给出一个技术方案
  • 在游戏引擎中部署RL模型会遇到哪些性能挑战?如何优化?
  • 如何验证训练出的NPC策略是否满足游戏需求?

职位点评

72
综合评分

米哈游AI预研岗,前沿技术栈,薪资高成长空间大,但工作强度可能较高。

更适合这类人
适合高度重视技术成长和职业发展、能够接受一定工作强度、对游戏AI有创新热情的求职者。
表现最好
成长发展
相对薄弱
工作生活
薪资福利80
成长发展90
工作生活50
使命价值70

薪资福利

80较高

米哈游作为头部游戏公司,薪资福利具有很强的市场竞争力(16薪、年终奖等),补偿性动机满足度较高。

薪资信号未披露(AI估算:30K-60K/月)

成长发展

90较高

职位涉及RL、LLM、UE5等前沿技术,预研性质强,成长空间极大,发展性动机高度满足。

技术前沿前沿/新兴技术
技术栈强化学习、深度强化学习、多智能体强化学习、LLM、Unreal Engine、游戏AI、NPC、奖励设计、仿真环境
成长机会前沿技术预研
业务类型profit_center

工作生活

50较低

游戏行业工作强度较高,未明确提及弹性工作或WLB,生活化动机满足度一般。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值

70中等

游戏行业本身能创造快乐,但该职位偏向技术预研,社会影响力中性偏正向。

行业发展高速增长赛道
社会影响中性/一般
创新程度开拓性创新(行业首创)
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

米哈游 的其他在招职位

  • 国际化营销渠道运营(第三方编制)

    米哈游 · 上海市
    AI 估算 · 15k-25k
  • 商业化活动运营-星布谷地

    米哈游 · 上海市
    AI 估算 · 20k-35k
  • 爬虫算法工程师

    米哈游 · 上海市
    AI 估算 · 25k-45k
  • 3D生成算法研究员实习生

    米哈游 · 上海市
    AI 估算 · 5k-10k
  • SRE运维工程师(基础架构)

    米哈游 · 上海市
    AI 估算 · 25k-40k

相似职位推荐

  • 【实习】无人机-飞控算法实习生

    美团 · 北京市
    AI 估算 · 4k-6k
  • Drive Systems – Thermal Management Function Engineer

    奔驰 · 北京市
    AI 估算 · 30k-50k
  • Digital Car Key Development Engineer_数字钥匙研发工程师

    奔驰 · 北京市
    AI 估算 · 20k-35k
  • AI Agent算法/工程专家

    京东 · 北京市
    AI 估算 · 30k-60k
  • 汽车系统架构工程师(车控系统)

    起亚 · 上海市
    AI 估算 · 30k-50k

米哈游 的其他在招职位

  • 国际化营销渠道运营(第三方编制)

    米哈游 · 上海市
    AI 估算 · 15k-25k
  • 商业化活动运营-星布谷地

    米哈游 · 上海市
    AI 估算 · 20k-35k
  • 爬虫算法工程师

    米哈游 · 上海市
    AI 估算 · 25k-45k
  • 3D生成算法研究员实习生

    米哈游 · 上海市
    AI 估算 · 5k-10k
  • SRE运维工程师(基础架构)

    米哈游 · 上海市
    AI 估算 · 25k-40k

相似职位推荐

  • 【实习】无人机-飞控算法实习生

    美团 · 北京市
    AI 估算 · 4k-6k
  • Drive Systems – Thermal Management Function Engineer

    奔驰 · 北京市
    AI 估算 · 30k-50k
  • Digital Car Key Development Engineer_数字钥匙研发工程师

    奔驰 · 北京市
    AI 估算 · 20k-35k
  • AI Agent算法/工程专家

    京东 · 北京市
    AI 估算 · 30k-60k
  • 汽车系统架构工程师(车控系统)

    起亚 · 上海市
    AI 估算 · 30k-50k