具备扎实的数据结构和算法功底,熟悉掌握常见有监督、无监督等算法模型的原理、优缺点、适用场景等基础知识
具有大模型开发、SFT、RL微调相关经验,LLM/多模态大模型开发经验优先
熟悉Tensorflow或者PyTorch机器学习框架,并有实际的模型训练、调优的项目经验
了解Transformer 等大模型核心算子(Attention、FFN、LayerNorm)底层实现机制与性能优化方法
熟悉深度学习模型从训练到推理的全链路转化逻辑,具备大模型训推一体化问题定位与优化经验者优先
优秀的分析问题、解决问题能力和团队合作意识