Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/米哈游/LLM预训练数据算法实习生
miHoYo logo
m
米哈游 (miHoYo)

职位信息

上海市
初级经验
实习生
仅现场办公
硕士
实习/见习

标签

分布式计算NLP数据工程LLMPySpark
💡

核心评价

顶尖游戏公司AI实习,前沿LLM数据工程,高成长潜力,WLB信息不明。

LLM预训练数据算法实习生

🤖 AI 估测:¥8K-15K

发布时间:14 天前

立即应聘

ℹ️关于这个职位

这是一个专注于大语言模型(LLM)预训练数据构建与优化的算法实习岗位
你将直接参与从数据发现、清洗、结构化到策略实验的全流程,通过科学的数据工程方法深刻影响模型的核心能力
岗位要求具备扎实的工程能力和对大模型数据流程的深入理解,是进入AI前沿领域的绝佳机会

✓工作职责

数据工程与基建: 负责大模型预训练数据的全流程构建,包括多源数据发现与评估、自动化清洗与去重、结构化与内容安全处理
数据策略与实验: 设计并执行数据配比、质量筛选、混合合成策略的对比实验,以科学方法驱动模型性能的持续提升
前沿数据构建: 洞察模型能力的瓶颈,主动构想并构建能突破当前模型“天花板”的新型训练数据(如高质量对话、复杂推理链、代码-文本对等),探索数据创新的前沿
数据效果分析: 分析模型在不同数据上的训练动态与性能表现,建立“数据-模型能力”的量化洞察,为数据决策提供依据

⭐最低要求

计算机科学、人工智能或相关专业硕士及以上在读
熟练掌握 Python 及主流数据处理框架(如 Pandas, PySpark),具备扎实的工程实现能力
深入理解大语言模型的预训练数据构建全流程(从数据源到模型输入),熟悉主流模型架构(如 Transformer)和基础训练范式
对语言模型和对话系统充满热情,热衷于探索其背后的工作原理与应用场景

👍优先资格

数据审美与洞察力: 对数据质量有敏锐的“直觉”和高标准的审美,能够从海量数据中识别出真正具有价值的“黄金”样本
实战经验: 具备大模型相关数据构建、训练或评估的实习/项目经验,或有实际参与对话/指令微调项目
学术能力: 在ACL, EMNLP, NeurIPS, ICLR等顶级会议发表过与NLP/LLM相关的论文
工程能力: 熟悉大规模数据处理流程与工具(如 Docker, Git, 分布式计算),代码风格清晰规范
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

米哈游 的其他在招职位

  • 业务助理

    米哈游

    上海市 · 仅现场办公

  • 资深系统策划(社交)-生活MMO

    米哈游

    上海市 · 仅现场办公

  • 版本运营-星布谷地

    米哈游

    上海市 · 仅现场办公

  • 资深系统策划-生活MMO

    米哈游

    上海市 · 仅现场办公

  • 资深市场公关(媒体关系方向)-原神

    米哈游

    上海市 · 仅现场办公

相似职位推荐

  • 多模态实习生

    叠纸游戏

    上海市 · 仅现场办公

  • 大模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 图形图像算法实习生

    叠纸游戏

    图形图像算法实习生 · 仅现场办公

  • 算法工程师(武汉)

    多点数智

    武汉市 · 仅现场办公

  • 算法工程师(北京)

    多点数智

    北京市 · 仅现场办公