本科及以上学历,语言类、计算机类、数据科学类相关专业优先,具备3年以上多语种数据处理或大模型数据生产相关工作经验
精通至少1门上述小语种,拥有C1证书(或同等水平语言证明),2-3种其他语种的基本语言学认识,能独立完成本语种数据质量校验与标准制定,英文可作为工作语言,听说能力佳,能撰写英文文档
熟悉大语言模型训练数据生产逻辑,掌握数据标注、预处理、质量评估的核心方法,具备搭建多语种数据生产框架的实操能力
具备基础的代码能力(如Python)或PE工具使用经验,能通过技术手段优化多语种数据处理效率,有自动化数据生产链路搭建经验者优先
具备优秀的统筹协调与跨团队沟通能力,能带领团队高效推进多语种数据生产任务,擅长解决不同语种的差异化协作问题
了解各目标语种的使用区域特性与表达习惯,对大语言模型多语种能力优化有一定认知,具备较强的问题解决能力与迭代思维