数学、计算机、控制科学、软件工程、人工智能等相关学科,硕士研究生及以上学历
熟悉大模型的相关基础知识,具备大语言模型相关训练或推理的基础知识
熟悉LLM的训练或Fine-tuning的方法,例如SFT/RLHF经验,或熟悉强化学习(RL)概念深入了解DPO、PPO相关算法知识
有大模型对齐项目经验,有agent开发、优化经验者优先
扎实的Python或者C++编程功底,了解PyTorch,Tensorflow,Deepspeed,Megatron,vLLM等大模型训练、推理技术栈
对技术有热情,关注大模型新研究和论文,对大模型的应用有兴趣
有独立解决问题的能力,有良好的技术沟通及协作能力,并乐于推动项目中问题的解决