计算机相关专业硕士及以上学历,研究方向为自然语言处理、机器学习、深度学习等相关方向,或者在该领域有相关工作经验,精通Python编程,熟悉Java/C++中至少一门语言
能够针对模型“不 work”的情况,从训练数据质量、任务定义、Prompt 设计、评测标准、奖励机制、工具调用链路、推理参数、模型对齐策略等多个维度进行拆解和诊断
熟悉常见模型问题,包括但不限于幻觉、指令跟随不稳定、格式不一致、任务完成率低、工具误用等,并能结合bad cases进行分析和迭代
了解阅读理解、序列标注、文本生成、文本分类等传统NLP任务,精通PyTorch/TensorFlow等训练框架,可以自己构造小模型验证算法有效性,并具备Qwen、Llama、Deepseek等模型的后训练实操经验