【大模型北斗实习】大模型复杂推理前沿研究
🤖 AI 估测:¥8K-15K
发布时间:27 天前
ℹ️关于这个职位
这是一个专注于大模型复杂推理前沿研究的实习岗位
你将深入探究生成式模型的高级推理机制,通过优化算法和应用大规模强化学习等技术,致力于提升大模型在逻辑、数学、代码等复杂任务上的推理表现
这是一个能让你接触AI最前沿技术、参与核心算法研究的宝贵机会
✓工作职责
研究内容包括但不限于:
1)复杂任务推理应用效果优化,诸如逻辑推理、数学推理、代码推理、跨模态推理、多模型决策等
2) RL scaling,通过大规模强化学习持续提升模型推理能力
3)Test time scaling,通过增加inference时消费的算力持续提升模型推理能力
⭐最低要求
1)熟悉NLP、LLM、RL等相关领域,对其中一个或多个方向有深入的研究经历,且有相关实际项目经验
2)熟悉Python、C++等至少一门编程语言,熟悉LINUX环境
3)熟悉 Megatron、DeepSpeed 等开源训练框架
4)熟悉PPO、DPO、GRPO等常用RL算法
👍优先资格
1)有影响力的开源项目中做出过核心贡献
2)发表过高水平论文优先(如NeurIPS,ICLR,ICML,ACL,EMNLP等)