米哈游的LLM Posttrain算法研究员薪资是多少？

该职位薪资范围为 35k–70k（人民币/月）。

LLM Posttrain算法研究员的工作地点在哪里？

该职位工作地点位于上海市、北京市。工作形式为仅现场办公。

该职位要求硕士学历及中级经验工作经验。

🤖 AI 估测：¥35K-70K

发布时间：14 天前

这是一个专注于大语言模型（LLM）后训练阶段的高级算法研究岗位

你将负责探索前沿的RLHF/RLAIF等对齐方法，优化模型在复杂推理、指令跟随和长上下文处理方面的能力

同时，你需要参与高质量训练数据的构建与治理，解决数据稀缺性问题，推动模型性能的持续提升

前沿算法探索：紧跟领域前沿技术，探索有效和高效的 RLHF 或 RLAIF 等post-training方法，提升模型在复杂逻辑任务中的推理能力

对齐策略研究：探索 PPO、DPO、GRPO 等 Post-training 算法的改进，优化模型在指令跟随、多轮对话一致性等方面的表现

高质量数据工程：负责 SFT 与 RLHF 阶段的数据治理，探索合成数据、数据演化及数据混合策略，解决数据稀缺性问题

长窗口与记忆：参与 Long Context 训练技术的优化，提升模型在长序列下的注意力保持与信息检索能力

计算机科学、人工智能或相关领域的硕士/博士

熟悉 Transformer 架构，熟练使用 PyTorch 及主流大模型训练框架（如 DeepSpeed, Megatron-LM, vLLM 等）

有 SFT、RLHF 的实际操作经验，理解训练过程中的稳定性与效率问题

具备优秀的工程实现能力和快速复现Paper的能力

在NeurIPS/ICML/ACL/EMNLP等顶级会议上发表过高引论文，或在ACM/ICPC，NOI/IOI，TopCoder等大赛上有获奖

主导过有影响力的LLM应用项目，或有丰富的技术落地经验

熟悉大规模语料处理、数据质量评估、数据合成及其在大模型训练中的应用

具有大规模训练大模型经历，了解分布式训练框架及对应的性能调优和资源管理

LLM Posttrain算法研究员

🤖 AI 估测：¥35K-70K

发布时间：14 天前