对大模型开发流程有深入认知,熟悉预训练、指令微调、RLHF等流程与框架,具备模型预训练、对齐、训练和推理加速、模型小型化和部署等方面的经验
熟悉Transformer等模型架构,对GPT系列、LLAMA系列和MoE等模型架构有深入理解并拥有大规模训练经验
具备扎实的算法和数学理论基础及良好的编程基础,熟悉自然语言处理、生成式AI和机器学习等技术,熟悉Python、Java等至少一种编程语言,熟悉PyTorch、Tensorflow等深度学习框架,对技术开发及应用有热情
目标感强,善于分析和发现问题,拆解简化,有想法并乐于挑战自我,能够从日常工作中发现新的空间
条理性强且有推动力,能够梳理繁杂的工作并建立有效机制,推动上下游配合完成目标
符合京东价值观:客户为先、创新、拼搏、担当、感恩、诚信