计算机、人工智能、数学、统计学、电子信息或相关专业本科高年级、硕士或博士在读
具备扎实的机器学习基础,对以下至少一个方向有较深入理解:
大语言模型与后训练
强化学习 / Online learning / Bandit / Sequence decision making
Agent / Tool use / Planning / Reasoning
记忆增强模型 / RAG / 长上下文建模
Reward modeling / Preference learning / PRM / ORM
熟悉 Python,具备较强的工程实现能力,能够独立完成实验、调参与结果分析
熟悉 PyTorch,并具有一定的大模型训练或推理实践经验
具备较强的论文阅读、问题抽象与实验设计能力,能够围绕一个研究问题提出清晰假设、设计验证方案并推进落地
具备良好的沟通协作能力与研究主动性,能够在不确定性较高的前沿问题中快速学习、持续推进