Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/米哈游/LLM算法研究员(后训练方向)
miHoYo logo
m
米哈游 (miHoYo)

职位信息

上海市 / 北京市
无经验要求
全职员工
仅现场办公
本科
普通员工/个人贡献者

标签

强化学习RAGLLM算法研究PPO游戏AI
💡

核心评价

技术前沿、成长性极佳的头部游戏公司AI算法岗,薪资竞争力强,但需面对一线城市现场办公及可能的快节奏工作环境。

LLM算法研究员(后训练方向)

🤖 AI 估测:¥25K-40K

发布时间:14 天前

立即应聘

ℹ️关于这个职位

这是一个专注于大型语言模型(LLM)后训练算法研究的岗位,你将探索LLM Agent在游戏设计、玩法及研发管线等场景的落地应用
核心工作包括构建后训练数据飞轮、研究强化学习等后训练策略以提升模型性能,并与游戏制作及工程团队紧密合作,共同打造新的AI游戏开发流程,创造次世代游戏体验

✓工作职责

研究LLM后训练算法,探索LLM Agent在游戏场景中的落地应用,包括在游戏设计、玩法以及研发管线中的应用等
针对各应用场景,收集LLM后训练数据,制定数据流转pipeline,参与构建后训练数据飞轮
研究LLM模型的后训练策略,使用强化学习等技术提升LLM Agent的性能,参与游戏领域LLM模型的调优、训练和迭代,推动LLM在游戏场景中的技术突破
与游戏制作管线中的其他团队紧密合作,打造新的AI游戏开发流程,创造次世代游戏体验
与工程团队紧密合作,交付稳定可靠的LLM服务

⭐最低要求

计算机科学、数学等相关领域的应届毕业生,有良好的编程能力和扎实数理基础
熟悉LLM常用工具和框架,如transformers,llama-factory,verl等
熟悉适用于LLM后训练的强化学习算法,如PPO,GRPO,DAPO等
有LLM项目实践经历,包括但不限于LLM模型训练,Code Agent,RAG系统,AI搜索,AI NPC,各类AI工作流等

👍优先资格

在NeurIPS/ICML/ICLR/ACL/EMNLP等会议或期刊上发表过论文者优先
获得过国际或国内信息竞赛奖项者优先
有游戏技术栈开发经历的优先,参与过 AI Agent 工业化工具开发优先
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

米哈游 的其他在招职位

  • 业务助理

    米哈游

    上海市 · 仅现场办公

  • 资深系统策划(社交)-生活MMO

    米哈游

    上海市 · 仅现场办公

  • 版本运营-星布谷地

    米哈游

    上海市 · 仅现场办公

  • 资深系统策划-生活MMO

    米哈游

    上海市 · 仅现场办公

  • 资深市场公关(媒体关系方向)-原神

    米哈游

    上海市 · 仅现场办公

相似职位推荐

  • 多模态实习生

    叠纸游戏

    上海市 · 仅现场办公

  • 大模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 图形图像算法实习生

    叠纸游戏

    图形图像算法实习生 · 仅现场办公

  • 算法工程师(武汉)

    多点数智

    武汉市 · 仅现场办公

  • 算法工程师(北京)

    多点数智

    北京市 · 仅现场办公