全日制本科及以上学历,计算机科学与技术、机器学习、人工智能、数学、统计学等相关专业背景,硕士及以上学历优先
具备大规模多模态数据清洗处理的经验,熟悉NLP领域经典模型和技术,熟悉文本数据分类及清洗、语音信号前处理、语音识别、语音合成等全流程模块者优先
深度学习算法功底扎实,拥有丰富的大模型研发经验,熟练使用如Deepspeed和Meatron-LM等训练框架,具有丰富的多机多卡训练经验
有参与开发Diffusion Models(扩散模型)、Autoregressive Models(自回归模型)相关研究或项目经验
在多模态领域有丰富的研究和工程落地经验,或发表过相关方向顶级学术论文者优先
熟悉主流深度学习框架的网络结构与算子底层实现细节,具备模型训练 / 推理调优、CPU/GPU 加速、分布式训练与推理部署的实操经验者优先
具备较强的自主学习能力与技术钻研精神,良好的跨团队沟通协作能力