计算机、数学、统计学等相关专业硕士及以上学历,至少三年NLP相关工作经验
精通深度学习框架(如PyTorch、TensorFlow),具备扎实的理论基础和编程能力
深入理解并能熟练应用Attention机制、Transformer模型及其变种,精通多种大模型优化技术(如Pretrain、PEFT、SFT、RLHF等)
熟悉算法工程线上化流程,具备特征预处理、召回、模型加载与推理、排序、后处理及接口注册等开发经验
熟悉主流大模型架构,如GPT、LLaMA、GLM等,具有DeepSpeed、Megatron等分布式训练框架的实践经验
具备优秀的分析与问题解决能力、逻辑思维能力和沟通协作能力,保持对新技术的好奇心,具备较强的责任心和诚信
符合京东价值观:客户为先、创新、拼搏、担当、感恩、诚信