能深入理解自然语言处理基础概念,如分词、词性标注、依存句法解析、语义角色标注、WordNet、语言模型等
了解并使用过常用自然语言处理开源库,如GloVe、Genism、NLTK、哈工大LTP等
能熟练运用正则表达式与命令行脚本
熟练掌握自然语言处理相关算法,如命名实体识别、文本分类、文本纠错、机器阅读理解、文本生成、实体消歧、关系抽取、短文本匹配等,并能应用于信息抽取、知识图谱构建、搜索、对话等实践项目
熟悉java/python/C++等编程语言中的一种,有较强工程化能力
熟悉Transformer及其谱系的相关模型原理和训练方法,如BERT、GPT-1/2/3、RoBERTa、ALBERT等
2年以上信息抽取、对话、搜索、推荐等相关算法经验,从事过召回、排序、文本解析、知识图谱构建等实践项目