计算机、信息工程、模式识别、人工智能、自动化、软件工程、电子工程、统计学、应用数学、物理学/量子计算、信息安全、信号与信息处理等专业的博士和优秀硕士
精通ReAct、AutoGPT等Agent范式及LangChain、AutoGen等开发框架,掌握LLM微调技术(LoRA/P-tuning)与强化学习算法(RFT/PPO/DPO)
对新技术和新算法保持敏锐的触觉,具备快速学习和应用的能力
良好的沟通能力、团队合作精神以及较强的问题解决能力
主导过大模型训练优化或模型调优,兼具工程实现能力与理论推导功底