美团的【大模型北斗实习】大模型复杂推理前沿研究薪资是多少？

该职位薪资范围为 8k–15k（人民币/月）。

【大模型北斗实习】大模型复杂推理前沿研究的工作地点在哪里？

该职位工作地点位于北京市。工作形式为仅现场办公。

该职位要求学历未注明学历及初级经验工作经验。

🤖 AI 估测：¥8K-15K

发布时间：27 天前

这是一个专注于大模型复杂推理前沿研究的实习岗位

你将深入探究生成式模型的高级推理机制，通过优化算法和应用大规模强化学习等技术，致力于提升大模型在逻辑、数学、代码等复杂任务上的推理表现

这是一个能让你接触AI最前沿技术、参与核心算法研究的宝贵机会

研究内容包括但不限于：

1）复杂任务推理应用效果优化，诸如逻辑推理、数学推理、代码推理、跨模态推理、多模型决策等

2) RL scaling，通过大规模强化学习持续提升模型推理能力

3）Test time scaling，通过增加inference时消费的算力持续提升模型推理能力

1）熟悉NLP、LLM、RL等相关领域，对其中一个或多个方向有深入的研究经历，且有相关实际项目经验

2）熟悉Python、C++等至少一门编程语言，熟悉LINUX环境

3）熟悉 Megatron、DeepSpeed 等开源训练框架

4）熟悉PPO、DPO、GRPO等常用RL算法

1）有影响力的开源项目中做出过核心贡献

2）发表过高水平论文优先（如NeurIPS,ICLR,ICML,ACL,EMNLP等）