Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

miHoYo logo
米哈游
LLM数据处理实习生
立即应聘

LLM数据处理实习生

发布于 大约 17 小时前

实习/见习

上海市
无经验要求
实习生
仅现场办公
本科
分布式计算
大数据
PyTorch
数据处理
LLM
数据清洗
Pipeline

AI 估算 · 4k–8k

实习岗位,上海地区,技术含量高,公司平台好,预计薪资在中等偏上水平。

职位详情

关于这个职位

这是一个在米哈游参与LLM大模型数据准备与清洗的实习岗位,你将构建高质量的训练数据集,并优化数据产出Pipeline

适合对NLP和大数据处理有浓厚兴趣、编程基础扎实的同学,能接触到前沿的AI技术

最低要求

计算机/软件工程等相关专业本科以上学历,拥有LLM相关专业硕士/博士学位者优先

扎实的编程基础、良好的编程风格,熟悉多线程编程、分布式计算、网络通信、内存管理、设计模式
熟悉多项大数据处理/分析相关的工具/框架,例如Hadoop、HDFS、Hive、MapReduce、Spark、Presto、ClickHouse、Ray、数据湖等
具备优秀的分析和解决问题能力,良好的团队合作精神及沟通意识

工作职责

参与LLM大模型的数据准备、数据清洗、数据实验等工作,构建高质量的LLM数据集

建设对标业内前沿的LLM训练数据集,并在此基础上进一步提升数据质量和多样性
构建高质量LLM数据产出的Pipeline,包括文本数据质量、Pipeline的优化等

优先资格

有前沿模型研发经验,涉及数据、评估、平台相关工作

具有大规模分布式架构设计开发经验
熟悉PyTorch深度学习框架,了解常见的深度学习算法

AI 洞察

优缺点分析

优点

  • 接触前沿的LLM技术栈,积累宝贵的数据处理经验
  • 公司平台大,资源丰富,学习机会多
  • 数据处理Pipeline技能可迁移性强,未来就业面广
  • 薪资待遇在实习生中具有竞争力
  • 需同时掌握多种大数据工具和编程语言
  • 适合对NLP和大模型有浓厚兴趣、编程基础扎实、愿意深耕数据处理细节的在校学生

缺点 / 挑战

  • 数据质量要求极高,工作可能重复且需要耐心
  • 岗位竞争激烈,对技术深度和广度有较高要求

角色解读

  • 可向LLM数据工程师或算法工程师发展,深入数据领域
  • 积累大规模数据处理经验后,转向数据科学家或AI研究员
  • 在米哈游内部可拓展至游戏AI、推荐系统等方向的研发
  • 参与LLM大模型的数据准备、清洗和实验,确保训练数据的质量
  • 对标业内前沿,设计和优化高质量训练数据集,提升数据多样性和覆盖度
  • 构建并优化数据产出的Pipeline,包括文本质量评估和自动化流程
  • 扎实的编程基础,熟悉多线程、分布式计算和网络通信
  • 掌握Hadoop、Spark等大数据处理工具,能够高效处理海量数据
  • 了解PyTorch等深度学习框架,具备机器学习基础

申请策略

  • 在求职信中表达对LLM数据工作的热情,并提及对米哈游产品的了解
  • 突出参与过的大数据或NLP相关项目,展示数据处理和编程能力
  • 强调Python、Spark等技术的熟练程度,以及项目中的解决思路
  • 如果有LLM或深度学习的项目经验,务必详细描述
  • 提前练习SQL和Hive操作,熟悉常见的数据清洗方法
  • 学习PyTorch基础,了解Transformer模型结构

面试指南

  • 针对技术问题,先明确问题核心,再结合项目经验分步讲解,最后总结
  • 对于开放性问题,采用STAR法则(情境、任务、行动、结果)组织回答
  • 请介绍一下你做过的一个数据处理项目,如何处理脏数据?
  • 你认为高质量训练数据集的关键因素有哪些?
  • 如何优化一个数据Pipeline的性能?举例说明
  • 你对Hadoop和Spark的理解是什么?它们各自的适用场景?
  • 用过哪些深度学习框架?对LLM有什么了解?
  • 复习大数据处理工具的原理和实战用法,准备一个完整的项目案例

匹配度报告

70
综合匹配度

前沿LLM数据处理实习,技术含量高,现场办公,成长快。

适合人群
适合追求技术成长、愿意投入时间学习前沿知识的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利60
成长发展90
工作生活50
使命价值80

薪资福利匹配

60中等

实习薪资未明确,但米哈游作为知名公司通常提供有竞争力的实习报酬,整体补偿较一般。

薪资信号未披露(AI估算:4K-8K/月)

成长发展匹配

90较高

该职位涉及前沿的LLM和大数据技术,能够快速积累稀有技能,成长空间大。

技术前沿前沿/新兴技术
技术栈LLM、Hadoop、Spark、PyTorch、大数据、分布式计算
业务类型ambiguous

工作生活匹配

50较低

未提及远程或弹性工作,通常实习生需要现场办公,WLB信息不明确。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值匹配

80较高

AI行业高速增长,工作影响技术发展具有一定社会价值,使命感较强。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

米哈游 的其他在招职位

  • 资深游戏测试工程师-UE5写实射击预研

    米哈游 · 上海市
    AI 估算 · 25k-45k
  • 灯光师(第三方编制)-绝区零(动画镜头)

    米哈游 · 上海市
    AI 估算 · 20k-35k
  • 游戏测试开发-UE5写实射击预研

    米哈游 · 上海市
    AI 估算 · 30k-50k
  • 视觉设计(市场宣发)-绝区零

    米哈游 · 上海市
    AI 估算 · 20k-35k
  • 行政专家(餐饮方向)

    米哈游 · 上海市
    AI 估算 · 28k-45k

相似职位推荐

  • 电池研发专家-PICO

    字节跳动 · 北京市
    AI 估算 · 30k-60k
  • 广告算法工程师

    京东 · 北京市
    AI 估算 · 30k-60k
  • 用户算法专家(北京/深圳)

    京东 · 北京市
    AI 估算 · 30k-60k
  • 视频处理和增强算法工程师-视频与边缘

    字节跳动 · 北京市
    AI 估算 · 25k-40k
  • 模型应用专家-商业生态与安全

    字节跳动 · 成都市
    AI 估算 · 20k-40k

米哈游 的其他在招职位

  • 资深游戏测试工程师-UE5写实射击预研

    米哈游 · 上海市
    AI 估算 · 25k-45k
  • 灯光师(第三方编制)-绝区零(动画镜头)

    米哈游 · 上海市
    AI 估算 · 20k-35k
  • 游戏测试开发-UE5写实射击预研

    米哈游 · 上海市
    AI 估算 · 30k-50k
  • 视觉设计(市场宣发)-绝区零

    米哈游 · 上海市
    AI 估算 · 20k-35k
  • 行政专家(餐饮方向)

    米哈游 · 上海市
    AI 估算 · 28k-45k

相似职位推荐

  • 电池研发专家-PICO

    字节跳动 · 北京市
    AI 估算 · 30k-60k
  • 广告算法工程师

    京东 · 北京市
    AI 估算 · 30k-60k
  • 用户算法专家(北京/深圳)

    京东 · 北京市
    AI 估算 · 30k-60k
  • 视频处理和增强算法工程师-视频与边缘

    字节跳动 · 北京市
    AI 估算 · 25k-40k
  • 模型应用专家-商业生态与安全

    字节跳动 · 成都市
    AI 估算 · 20k-40k