计算机科学、人工智能、自然语言处理或相关领域的硕士或博士学位
对以下至少一种技术有较为深入的了解和系统的学习,有过对应的科研项目经验或者 3 个月以上的实习经验:
大模型相关技术:预训练、SFT、PEFT、强化学习、对齐、prompt engineering、RAG、Agent等
多模态相关技术:如 ASR/TTS、视觉内容生成、端到端多模态大模型、数字人等
自然语言处理相关技术:包括信息抽取、知识图谱、自然语言问答等
具备良好的编程实现能力,熟练掌握python/java 等编程语言,熟悉 pytorch、transformers等机器学习套件
有较强的研究能力,在大模型研究领域顶级会议发表过高质量论文者优先
出色的问题解决能力和创新能力,能够解决复杂的技术挑战和业务挑战