硕士及以上学历,专业背景涵盖计算机科学或相关领域,至少3年以上相关经验
具备扎实的自然语言处理、图像处理和深度学习理论基础,参与过多个NLP相关项目
具备大模型实战经验,包括大模型落地业务场景识别、数据清洗/构造,LLM训练和调优,检索增强生成(RAG)、LLM Agent等
掌握主流大语言模型原理,如chatGPT、Llama、Baichuan、GLM等,掌握常用的大语言模型微调方式,如Lora、Ptuning等
精通Python编程,熟练使用TensorFlow/PyTorch等主流深度学习框架
有极强的学习能力和意愿,对大模型技术的现状和发展趋势有深刻理解和热情,积极沟通,乐于创新
具备责任心和积极主动的工作态度,良好的沟通能力和团队合作能力,对将大数据人工智能技术应用于实际业务场景并产生商业价值具有强烈热情