Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

miHoYo logo
米哈游
LLM数据处理实习生
立即应聘

LLM数据处理实习生

发布于 大约 2 个月前

实习/见习

上海市
无经验要求
实习生
仅现场办公
本科
研究与开发 (研发)
分布式计算
大数据
PyTorch
数据处理
LLM
数据清洗
Pipeline

AI 估算 · 4k–8k

实习岗位,上海地区,技术含量高,公司平台好,预计薪资在中等偏上水平。

职位详情

关于这个职位

这是一个在米哈游参与LLM大模型数据准备与清洗的实习岗位,你将构建高质量的训练数据集,并优化数据产出Pipeline

适合对NLP和大数据处理有浓厚兴趣、编程基础扎实的同学,能接触到前沿的AI技术

最低要求

计算机/软件工程等相关专业本科以上学历,拥有LLM相关专业硕士/博士学位者优先

扎实的编程基础、良好的编程风格,熟悉多线程编程、分布式计算、网络通信、内存管理、设计模式
熟悉多项大数据处理/分析相关的工具/框架,例如Hadoop、HDFS、Hive、MapReduce、Spark、Presto、ClickHouse、Ray、数据湖等
具备优秀的分析和解决问题能力,良好的团队合作精神及沟通意识

工作职责

参与LLM大模型的数据准备、数据清洗、数据实验等工作,构建高质量的LLM数据集

建设对标业内前沿的LLM训练数据集,并在此基础上进一步提升数据质量和多样性
构建高质量LLM数据产出的Pipeline,包括文本数据质量、Pipeline的优化等

优先资格

有前沿模型研发经验,涉及数据、评估、平台相关工作

具有大规模分布式架构设计开发经验
熟悉PyTorch深度学习框架,了解常见的深度学习算法

AI 洞察

优缺点分析

优点

  • 接触前沿的LLM技术栈,积累宝贵的数据处理经验
  • 公司平台大,资源丰富,学习机会多
  • 数据处理Pipeline技能可迁移性强,未来就业面广
  • 薪资待遇在实习生中具有竞争力
  • 需同时掌握多种大数据工具和编程语言
  • 适合对NLP和大模型有浓厚兴趣、编程基础扎实、愿意深耕数据处理细节的在校学生

缺点 / 挑战

  • 数据质量要求极高,工作可能重复且需要耐心
  • 岗位竞争激烈,对技术深度和广度有较高要求

角色解读

  • 可向LLM数据工程师或算法工程师发展,深入数据领域
  • 积累大规模数据处理经验后,转向数据科学家或AI研究员
  • 在米哈游内部可拓展至游戏AI、推荐系统等方向的研发
  • 参与LLM大模型的数据准备、清洗和实验,确保训练数据的质量
  • 对标业内前沿,设计和优化高质量训练数据集,提升数据多样性和覆盖度
  • 构建并优化数据产出的Pipeline,包括文本质量评估和自动化流程
  • 扎实的编程基础,熟悉多线程、分布式计算和网络通信
  • 掌握Hadoop、Spark等大数据处理工具,能够高效处理海量数据
  • 了解PyTorch等深度学习框架,具备机器学习基础

申请策略

  • 在求职信中表达对LLM数据工作的热情,并提及对米哈游产品的了解
  • 突出参与过的大数据或NLP相关项目,展示数据处理和编程能力
  • 强调Python、Spark等技术的熟练程度,以及项目中的解决思路
  • 如果有LLM或深度学习的项目经验,务必详细描述
  • 提前练习SQL和Hive操作,熟悉常见的数据清洗方法
  • 学习PyTorch基础,了解Transformer模型结构

面试指南

  • 针对技术问题,先明确问题核心,再结合项目经验分步讲解,最后总结
  • 对于开放性问题,采用STAR法则(情境、任务、行动、结果)组织回答
  • 请介绍一下你做过的一个数据处理项目,如何处理脏数据?
  • 你认为高质量训练数据集的关键因素有哪些?
  • 如何优化一个数据Pipeline的性能?举例说明
  • 你对Hadoop和Spark的理解是什么?它们各自的适用场景?
  • 用过哪些深度学习框架?对LLM有什么了解?
  • 复习大数据处理工具的原理和实战用法,准备一个完整的项目案例

职位点评

70
综合评分

前沿LLM数据处理实习,技术含量高,现场办公,成长快。

更适合这类人
适合追求技术成长、愿意投入时间学习前沿知识的求职者。
表现最好
成长发展
相对薄弱
工作生活
薪资福利60
成长发展90
工作生活50
使命价值80

薪资福利

60中等

实习薪资未明确,但米哈游作为知名公司通常提供有竞争力的实习报酬,整体补偿较一般。

薪资信号未披露(AI估算:4K-8K/月)

成长发展

90较高

该职位涉及前沿的LLM和大数据技术,能够快速积累稀有技能,成长空间大。

技术前沿前沿/新兴技术
技术栈LLM、Hadoop、Spark、PyTorch、大数据、分布式计算
业务类型ambiguous

工作生活

50较低

未提及远程或弹性工作,通常实习生需要现场办公,WLB信息不明确。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值

80较高

AI行业高速增长,工作影响技术发展具有一定社会价值,使命感较强。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

米哈游 的其他在招职位

  • SRE运维工程师(基础架构)

    米哈游 · 上海市
    AI 估算 · 25k-40k
  • 爬虫浏览器内核工程师

    米哈游 · 上海市
    AI 估算 · 40k-70k
  • SRE运维工程师(企业效能)

    米哈游 · 上海市
    AI 估算 · 25k-40k
  • 游戏项目管理实习生

    米哈游 · 上海市
    AI 估算 · 4k-7k
  • 国际化品牌实习生(内容生态方向)-绝区零

    米哈游 · 上海市
    AI 估算 · 4k-6k

相似职位推荐

  • 智能控制算法实习生

    小米 · 武汉市
    AI 估算 · 4k-6k
  • 小米汽车-被动安全试验专家

    小米 · 北京市
    AI 估算 · 30k-50k
  • 电气性能开发工程师

    小米 · 上海市
    AI 估算 · 18k-28k
  • 音频算法DSP资深工程师7444

    新紫光集团 · 重庆市
    AI 估算 · 25k-40k
  • 音频算法(DSP)专家7446

    新紫光集团 · 上海市
    AI 估算 · 30k-50k

米哈游 的其他在招职位

  • SRE运维工程师(基础架构)

    米哈游 · 上海市
    AI 估算 · 25k-40k
  • 爬虫浏览器内核工程师

    米哈游 · 上海市
    AI 估算 · 40k-70k
  • SRE运维工程师(企业效能)

    米哈游 · 上海市
    AI 估算 · 25k-40k
  • 游戏项目管理实习生

    米哈游 · 上海市
    AI 估算 · 4k-7k
  • 国际化品牌实习生(内容生态方向)-绝区零

    米哈游 · 上海市
    AI 估算 · 4k-6k

相似职位推荐

  • 智能控制算法实习生

    小米 · 武汉市
    AI 估算 · 4k-6k
  • 小米汽车-被动安全试验专家

    小米 · 北京市
    AI 估算 · 30k-50k
  • 电气性能开发工程师

    小米 · 上海市
    AI 估算 · 18k-28k
  • 音频算法DSP资深工程师7444

    新紫光集团 · 重庆市
    AI 估算 · 25k-40k
  • 音频算法(DSP)专家7446

    新紫光集团 · 上海市
    AI 估算 · 30k-50k