熟练掌握PyTorch、Swift、Verl等一种或多种大模型训练框架,具备文本大模型(如代码大模型、对话模型)及大模型智能体(Agent)系统的开发与调优经验
熟悉大模型训练范式,包括增量预训练(CPT)、有监督微调(SFT)、强化学习(RL)等,具备分布式训练经验
熟悉RLVR(可验证奖励强化学习)或者Agentic-RL的流程,有文本任务强化学习、代码生成或智能体决策相关项目经验者优先
具备自然语言处理、程序语言处理或代码智能相关项目经验,熟悉常见文本大模型与代码评测数据集
具备知识检索与问答(RAG)系统开发经验,熟悉相关技术栈(如向量数据库、检索器、重排序等)者优先
计算机科学、人工智能、软件工程等相关专业硕士及以上学历,或在ACL、EMNLP、NeurIPS、ICML、ICLR等AI/NLP/代码相关顶会发表论文者优先