米哈游的LLM预训练算法实习生（数据与Scaling Law方向）薪资是多少？

该职位薪资范围为 8k–15k（人民币/月）。

LLM预训练算法实习生（数据与Scaling Law方向）的工作地点在哪里？

该职位工作地点位于上海市。工作形式为仅现场办公。

该职位要求硕士学历及初级经验工作经验。

🤖 AI 估测：¥8K-15K

发布时间：14 天前

这是一个专注于大模型预训练底层规律研究的算法实习岗位

你将探索数据、模型与算力之间的核心关系，研究数据学习的效率机制和效用度量，旨在揭示模型训练的物理规律，为优化训练过程提供理论依据

工作职责: 你将深入探索大模型训练中“数据-模型-算力”的核心关系，致力于揭示数据学习的底层物理规律

具体工作内容包括：

数据学习效率机制研究

探索数据分布、数据密度与模型学习效果之间的映射关系，研究这一规律随模型规模（Model Size）及网络结构（Architecture）变化的演变趋势

设计量化指标，精准度量训练数据中不同部分的状态（如 Under-learned vs. Over-learned），并基于此探索相关的 Scaling Law，指导数据配比优化

数据效用度量与预测

构建数据总效用的评估体系，探索如何预测一份数据整体的潜在学习收益

研究模型训练动力学，判断训练特定阶段的数据效用饱和点（Saturation Point），评估继续训练的边际收益（ROI），为训练停止或数据切换提供理论依据

计算机、数学、物理或相关专业硕士/博士在读

熟练掌握 Python 及 PyTorch/JAX 等深度学习框架

深刻理解学习机制：对深度学习模型的内在学习机制有过深入研究，熟悉 "Physics of Language Models" 系列的研究思路，具备较强的理论分析或数学建模能力

Scaling Law 研究经验：对模型 Scaling 规律有过系统性研究，熟悉各种形式的 Scaling Law（如 Data-Compute-Parameter 之间的权衡），并有相关实验验证经验

在 ICML, NeurIPS, ICLR, CVPR 等顶级会议发表过相关领域（大模型理论、数据科学、优化算法）论文

熟悉 Megatron-LM, DeepSpeed 等大规模分布式训练框架

预训练实战经验：具备从零构建或处理大规模预训练数据（Pre-train Data）的经验，并实际训练过不同参数规模的模型，熟悉分布式训练痛点

LLM预训练算法实习生（数据与Scaling Law方向）

🤖 AI 估测：¥8K-15K

发布时间：14 天前