数据生产:根据数据集的设计需求和用途,为数据集制定可执行、可质检的规范
对数据集阶段性质检,迭代标注规范
大模型使用:熟练Prompt Engineering、搭建workflow和AI Agent,实现数据的智能化标注和质检
大模型评估:多模态语音大模型的客观与主观评测,实时跟进大模型最新进展,设计模型评估维度,反馈给团队评估结果,并能从数据的视角提出优化模型路径
数据产品设计:参与数据生产平台、模型评估平台、prompt调试平台的设计与搭建,设计前后端交互界面
团队协作:与产品和技术团队紧密配合,快速、高效推动语音和NLP能力的方案设计、研发、效果验证