Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/米哈游/LLM Posttrain算法研究员
miHoYo logo
m
米哈游 (miHoYo)

职位信息

上海市 / 北京市
中级经验
全职员工
仅现场办公
硕士
普通员工/个人贡献者

标签

PyTorchLLMSFT数据合成分布式训练DeepSpeedPPORLHFDPO
💡

核心评价

顶尖大厂的前沿AI算法岗,技术成长性极佳,薪资竞争力强,但工作地点和模式较为传统。

LLM Posttrain算法研究员

🤖 AI 估测:¥35K-70K

发布时间:14 天前

立即应聘

ℹ️关于这个职位

这是一个专注于大语言模型(LLM)后训练阶段的高级算法研究岗位
你将负责探索前沿的RLHF/RLAIF等对齐方法,优化模型在复杂推理、指令跟随和长上下文处理方面的能力
同时,你需要参与高质量训练数据的构建与治理,解决数据稀缺性问题,推动模型性能的持续提升

✓工作职责

前沿算法探索:紧跟领域前沿技术,探索有效和高效的 RLHF 或 RLAIF 等post-training方法,提升模型在复杂逻辑任务中的推理能力
对齐策略研究: 探索 PPO、DPO、GRPO 等 Post-training 算法的改进,优化模型在指令跟随、多轮对话一致性等方面的表现
高质量数据工程: 负责 SFT 与 RLHF 阶段的数据治理,探索合成数据、数据演化及数据混合策略,解决数据稀缺性问题
长窗口与记忆: 参与 Long Context 训练技术的优化,提升模型在长序列下的注意力保持与信息检索能力

⭐最低要求

计算机科学、人工智能或相关领域的硕士/博士
熟悉 Transformer 架构,熟练使用 PyTorch 及主流大模型训练框架(如 DeepSpeed, Megatron-LM, vLLM 等)
有 SFT、RLHF 的实际操作经验,理解训练过程中的稳定性与效率问题
具备优秀的工程实现能力和快速复现Paper的能力

👍优先资格

在NeurIPS/ICML/ACL/EMNLP等顶级会议上发表过高引论文,或在ACM/ICPC,NOI/IOI,TopCoder等大赛上有获奖
主导过有影响力的LLM应用项目,或有丰富的技术落地经验
熟悉大规模语料处理、数据质量评估、数据合成及其在大模型训练中的应用
具有大规模训练大模型经历,了解分布式训练框架及对应的性能调优和资源管理
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

米哈游 的其他在招职位

  • 业务助理

    米哈游

    上海市 · 仅现场办公

  • 资深系统策划(社交)-生活MMO

    米哈游

    上海市 · 仅现场办公

  • 版本运营-星布谷地

    米哈游

    上海市 · 仅现场办公

  • 资深系统策划-生活MMO

    米哈游

    上海市 · 仅现场办公

  • 资深市场公关(媒体关系方向)-原神

    米哈游

    上海市 · 仅现场办公

相似职位推荐

  • 多模态实习生

    叠纸游戏

    上海市 · 仅现场办公

  • 大模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 图形图像算法实习生

    叠纸游戏

    图形图像算法实习生 · 仅现场办公

  • 算法工程师(武汉)

    多点数智

    武汉市 · 仅现场办公

  • 算法工程师(北京)

    多点数智

    北京市 · 仅现场办公