米哈游的LLM Evaluation算法研究员薪资是多少？

该职位薪资范围为 35k–60k（人民币/月）。

LLM Evaluation算法研究员的工作地点在哪里？

该职位工作地点位于上海市、北京市。工作形式为仅现场办公。

该职位要求硕士学历及中级经验工作经验。

🤖 AI 估测：¥35K-60K

发布时间：14 天前

这是一个专注于大语言模型（LLM）评估与对齐的算法研究岗位

你将负责设计并构建针对复杂能力（如逻辑推理、代码生成）的自动化评测体系，深入研究RLHF对齐算法中的偏好建模问题，并开发基于模型的自动评估技术

核心目标是建立数据驱动的模型迭代闭环，通过评测反馈指导模型训练与优化

复杂能力评测：针对逻辑推理、代码生成、长文本理解等高难度能力，设计并构建自动化评测集与评估管线

主观偏好建模：深入研究 RLHF 中的 Reward Model 表现，分析 Reward Hacking 现象

建立细粒度的评估准则，提升模型在开放式生成任务中的对齐效果

Model-based Evaluation：研发并优化 LLM-as-a-Judge 技术，通过训练专用的 Critic Model 来替代人工进行大规模、高一致性的自动评估

数据驱动迭代：建立从评测结果到训练数据的反馈闭环，通过Bad Case分析指导 SFT 数据配比与 Post-training 策略调整

计算机、AI或相关领域硕士及以上学历，具备扎实的机器学习理论基础

熟悉主流 LLM 评测框架及其局限性，有构建私有评测集的经验

对 RLHF、DPO、PPO 等对齐算法有深入理解，熟悉 Reward Model 的训练与评估难点

具备极强的数据敏感度，能从统计数据中发现模型能力的微弱变化

在 NeurIPS/ICML/ICLR/ACL 等顶级会议发表过关于 Evaluation、Safety、Alignment 方向的论文

有 Math/Code Reasoning 或 Agent 相关评测的实战经验

熟悉大模型训练全流程，能够独立完成从数据处理到模型微调的实验

在 ACM/ICPC, Kaggle 等算法竞赛中取得优异成绩

LLM Evaluation算法研究员

🤖 AI 估测：¥35K-60K

发布时间：14 天前