Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/米哈游/LLM Evaluation算法实习生
miHoYo logo
m
米哈游 (miHoYo)

职位信息

上海市 / 北京市
无经验要求
实习生
仅现场办公
硕士
实习/见习

标签

数据分析SFTRLHFReward Model偏好对齐Llm EvaluationLlm As Judge
💡

核心评价

前沿大厂LLM评估实习,技术成长性极佳,薪资符合实习标准,需现场办公。

LLM Evaluation算法实习生

🤖 AI 估测:¥8K-15K

发布时间:14 天前

立即应聘

ℹ️关于这个职位

这是一个专注于大语言模型(LLM)评估与优化的算法实习岗位
你将负责深入分析模型评估数据,研发可靠的评估管线与方法,并围绕偏好对齐目标构建和改进奖励模型
该职位旨在通过前沿的评测技术,为LLM的训练迭代提供关键指导,是深入理解并参与大模型研发核心环节的绝佳机会

✓工作职责

对大语言模型评估结果做深入数据分析,理解不同评估指标与用户体验、需求之间的关联,对模型训练迭代提供指导意见
研发可靠的大语言模型评估管线,制定针对角色扮演、创意写作等能力的自动或人工评测准则与方法,构建对应的评测数据集
紧扣偏好对齐目标,分析和清洗奖励模型数据,研发不易被reward hack、偏好有深度的奖励模型

⭐最低要求

计算机科学、人工智能或相关领域的在读硕士或博士
对大语言模型评测体系有较深入的理解,并能构建评估方法以改进模型性能,掌握LLM as Judge技术
对大语言模型的工作原理有较深入的理解,熟悉BT reward model训练和SFT训练,熟悉RL训练更佳
有良好的中英文阅读和鉴赏能力,有良好的沟通合作能力

👍优先资格

在ACM/ICPC,NOI/IOI,TopCoder等编程大赛上有获奖
在模型评估方向有NeurIPS/ICML/ACL/EMNLP顶级论文发表,积极追踪大模型方向前沿进展和应用
参与过有影响力的LLM应用项目,有交互界面设计、数据标注相关经历
具备良好的文学素养,对游戏、影视、小说等人文和娱乐内容有浓厚兴趣
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

米哈游 的其他在招职位

  • 业务助理

    米哈游

    上海市 · 仅现场办公

  • 资深系统策划(社交)-生活MMO

    米哈游

    上海市 · 仅现场办公

  • 版本运营-星布谷地

    米哈游

    上海市 · 仅现场办公

  • 资深系统策划-生活MMO

    米哈游

    上海市 · 仅现场办公

  • 资深市场公关(媒体关系方向)-原神

    米哈游

    上海市 · 仅现场办公

相似职位推荐

  • 多模态实习生

    叠纸游戏

    上海市 · 仅现场办公

  • 大模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 图形图像算法实习生

    叠纸游戏

    图形图像算法实习生 · 仅现场办公

  • 算法工程师(武汉)

    多点数智

    武汉市 · 仅现场办公

  • 算法工程师(北京)

    多点数智

    北京市 · 仅现场办公