
普通员工/个人贡献者
AI 估算 · 25k–45k
基于上海游戏行业高水平,结合岗位对RLHF和3D生成的技术要求,具有较强竞争力
该职位是米哈游3D生成方向的研究员岗位,核心工作是利用强化学习算法(如DPO、PPO、GRPO)对三维生成大模型进行偏好对齐,提升生成质量,并探索RL scaling问题以增强模型推理能力
硕士/博士及以上学历(或在读),计算机/数学等相关专业优先
面向三维生成大模型,利用强化学习算法进行偏好对齐,提升模型生成质量
有AI Alignment相关研究或大模型应用项目经历的优先
优点
缺点 / 挑战
头部游戏公司前沿RLHF研究岗,技术价值高,薪资优厚,但WLB可能一般。
米哈游作为行业头部公司,薪资水平具有竞争力,但JD未明确具体待遇,存在不确定性。
岗位聚焦RLHF和3D生成等前沿技术,研究导向强,能显著提升个人技术深度和学术影响力。
工作地点上海,JD未提及远程或弹性工作,游戏行业加班现象普遍,WLB不确定。
3D生成+RLHF属于AI前沿,但游戏行业的社会影响力相对中性,个人成就感来自技术创新。