Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

miHoYo logo
米哈游
LLM Posttrain研究员
立即应聘

LLM Posttrain研究员

发布于 大约 5 小时前

普通员工/个人贡献者

上海市 / 北京市
高级经验
全职员工
仅现场办公
硕士
PyTorch
数据处理
自然语言处理
LLM
分布式训练
创意写作
RLHF
Rlaif
角色扮演
评估流程

AI 估算 · 35k–65k

基于高级研究员岗位及米哈游的行业薪酬竞争力,结合上海/北京生活成本,估算月薪在35k-65k之间。

职位详情

关于这个职位

作为LLM Posttrain研究员,你将聚焦大语言模型的后训练优化,探索RLHF/RLAIF等前沿技术,提升模型的拟人化和创意能力

你需要与产品和工程团队紧密协作,构建数据处理与评估流程,推动技术落地
适合对NLP和生成式AI有热情、具备扎实算法功底的研究型人才

最低要求

计算机科学、人工智能或相关领域的硕士或博士学历,或具有等同的研究经历

在自然语言处理、大语言模型研究或机器学习领域中具有丰富的经验
具备扎实的代码与算法基础,熟练掌握PyTorch等深度学习框架
具备有效的沟通和协作技能,对探索新技术和推动技术创新充满热情

工作职责

紧跟领域前沿技术,探索有效和高效的 RLHF 或 RLAIF 等post-training方法,提升大语言模型的拟人化、趣味性, 以及角色扮演、创意写作等方向的综合能力

参与预研项目的研发,与产品、策划、工程等多个团队紧密协作,拆解并设计具体的算法解决方案和交付目标
构建高质量、多领域的数据处理及分析流程,包括但不限于数据清洗、数据合成、数据混合策略等
构建稳健可靠的算法评估流程,揭示大语言模型能力边界和潜在机制

优先资格

在NeurIPS/ICML/ACL/EMNLP等顶级会议上发表过高引论文

在ACM/ICPC,NOI/IOI,TopCoder等大赛上有获奖
主导过有影响力的LLM应用项目,或有丰富的技术落地经验
熟悉大规模语料处理、数据质量评估、数据合成及其在大模型训练中的应用
具有大规模训练大模型经历,了解分布式训练框架及对应的性能调优和资源管理
有过RLHF、RLAIF的相关经验

AI 洞察

优缺点分析

优点

  • 前沿技术领域:直接参与LLM核心技术研发,积累稀缺的后训练经验
  • 顶级平台:米哈游资金充足、算力资源丰富,项目影响力大
  • 跨团队协作:与产品和工程深度合作,提升综合能力
  • 成长空间:研究氛围浓厚,有发论文和参会机会
  • 技术难度高:LLM后训练尚在探索期,需要极强的创新和实验能力
  • 工作强度大:预研项目周期紧,可能需要快速迭代和试错
  • 竞争激烈:岗位吸引大量顶尖人才,面试门槛高

缺点 / 挑战

  • 适合对NLP和生成式AI有浓厚兴趣、喜欢挑战未知问题、具备扎实算法功底和自驱力的研究型人才

角色解读

  • 技术方向:成长为LLM领域专家,主导核心算法研发
  • 管理方向:带领团队负责大模型后训练或相关研究方向
  • 产品方向:结合业务需求,将技术成果转化为实际产品功能
  • 探索并应用RLHF/RLAIF等后训练方法,优化大语言模型的拟人化和创意表现
  • 参与预研项目,与产品、策划、工程团队协作,设计算法解决方案并推动交付
  • 构建数据处理与评估流程,包括数据清洗、合成、混合以及模型能力边界分析
  • 扎实的机器学习/NLP基础,熟悉Transformer架构和大语言模型训练
  • 精通PyTorch等深度学习框架,具备良好的代码能力
  • 具备分布式训练经验,了解性能调优和资源管理
  • 良好的沟通协作能力,能跨团队推动技术落地

申请策略

  • 深入了解米哈游的游戏和AI产品,思考LLM在其中的应用场景
  • 准备一个技术提案,展示你对后训练方法的独特见解
  • 突出LLM相关项目经验,特别是RLHF、数据合成、模型评估等
  • 强调顶会论文、竞赛获奖或开源贡献
  • 展示分布式训练和大规模模型训练经历
  • 描述跨团队协作和技术落地的实际案例
  • 系统学习RLHF/RLAIF原理,阅读相关论文并尝试复现
  • 熟悉数据合成和清洗工具,如MassiveText、datasets库

面试指南

  • 对于技术问题,先阐明核心概念,再结合自身经验举例,最后总结关键点
  • 对于设计类问题,遵循“目标-方案-评估”三步法,给出多方案比较
  • 对于经验问题,使用STAR法则(情境、任务、行动、结果)结构化回答
  • 请详细解释RLHF的流程和关键挑战
  • 如果给一个预训练模型,你如何设计post-training方案来提升角色扮演能力?
  • 描述你处理过大模型训练数据的一个案例,包括数据清洗和混合策略
  • 你如何评估生成模型的拟人化和趣味性?设计一个评估指标
  • 在大规模分布式训练中,你遇到过哪些性能瓶颈?如何调优?

匹配度报告

72
综合匹配度

顶级AI研究岗,前沿技术栈,高薪资高成长,但工作强度和WLB挑战较大。

适合人群
最适合追求技术成长和前沿研究的求职者,愿意为职业发展投入时间和精力。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展95
工作生活40
使命价值70

薪资福利匹配

85较高

米哈游薪资待遇在业内属于第一梯队,福利完善,但具体薪资未公开,存在面议可能。整体对补偿性动机满足度较高。

薪资信号未披露(AI估算:35K-65K/月)

成长发展匹配

95较高

岗位涉及LLM最前沿技术,研究氛围浓厚,成长空间极大。JD明确提到探索新技术,且预期有论文和项目产出。

技术前沿前沿/新兴技术
技术栈LLM、RLHF、RLAIF、PyTorch、分布式训练
成长机会紧跟领域前沿技术、探索新技术、推动技术创新
业务类型profit_center

工作生活匹配

40较低

工作地点上海/北京,预计为现场办公,公司未提及弹性工作制,游戏行业普遍存在加班可能,WLB一般。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

70中等

AI行业高速增长,但岗位更偏向技术研究而非直接社会价值,使命感一般。不过米哈游产品具文化影响力,有一定正向作用。

行业发展高速增长赛道
社会影响中性/一般
创新程度开拓性创新(行业首创)
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

米哈游 的其他在招职位

  • AI数据湖产品经理

    米哈游 · 上海市
    AI 估算 · 20k-35k
  • 媒体关系

    米哈游 · 上海市
    AI 估算 · 15k-25k
  • 技术美术(场景特效)-原神

    米哈游 · 上海市
    AI 估算 · 25k-40k
  • IT综合支持(第三方编制)

    米哈游 · 上海市
    AI 估算 · 8k-14k
  • 配音监制(中配)-崩坏:星穹铁道

    米哈游 · 上海市
    AI 估算 · 15k-25k

相似职位推荐

  • Polymer Interior Analysis 2

    大众汽车 · 合肥市
    AI 估算 · 15k-25k
  • Camera质量评测工程师-移动OS

    字节跳动 · 深圳市
    AI 估算 · 25k-45k
  • Assistant Manager, Technical Development (007366)

    巴斯夫 · 广州市
    AI 估算 · 15k-25k
  • 算法工程师 - 在线建图

    小马智行 · 上海市
    AI 估算 · 20k-40k
  • 【无人车北斗实习】世界模型实习生(感知数据生成方向)

    美团 · 北京市
    AI 估算 · 8k-15k

米哈游 的其他在招职位

  • AI数据湖产品经理

    米哈游 · 上海市
    AI 估算 · 20k-35k
  • 媒体关系

    米哈游 · 上海市
    AI 估算 · 15k-25k
  • 技术美术(场景特效)-原神

    米哈游 · 上海市
    AI 估算 · 25k-40k
  • IT综合支持(第三方编制)

    米哈游 · 上海市
    AI 估算 · 8k-14k
  • 配音监制(中配)-崩坏:星穹铁道

    米哈游 · 上海市
    AI 估算 · 15k-25k

相似职位推荐

  • Polymer Interior Analysis 2

    大众汽车 · 合肥市
    AI 估算 · 15k-25k
  • Camera质量评测工程师-移动OS

    字节跳动 · 深圳市
    AI 估算 · 25k-45k
  • Assistant Manager, Technical Development (007366)

    巴斯夫 · 广州市
    AI 估算 · 15k-25k
  • 算法工程师 - 在线建图

    小马智行 · 上海市
    AI 估算 · 20k-40k
  • 【无人车北斗实习】世界模型实习生(感知数据生成方向)

    美团 · 北京市
    AI 估算 · 8k-15k