在大模型方向有一定经验,对Pre-train、SFT等技术有深入了解
有良好的英文读写能力和扎实的数学基础,有快速学习新技术的能力
有扎实的编程基础,熟悉Python/C++等编程语言,具有快速复现前沿论文的能力
熟悉至少一个深度学习和大模型训练框架,包括PyTorch、TensorFlow、MXNet、Caffe、HuggingFace、DeepSpeed等
有较强的研究能力,在国际顶尖会议或期刊(包括但不限于CVPR, ICCV, ECCV, NeurIPS, ICML, ICLR, AAAI, IJCAI, ACMMM, TIP, TPAMI, IJCV,ACL、EMNLP、NAACL、COLING、CoNLL、NLPCC等)上发表过论文者优先
较强的业务问题到算法模型的建模能力,有强烈的求知欲、自驱力和进取心,能及时关注和学习业界最佳实践