审核策略设计与优化: 基于大模型能力,设计与迭代内容安全审核策略(含Prompt、规则、知识增强、小模型协同等),持续提升审核的准确率、召回率与边界判定能力
2. 效果评估与数据驱动优化: 构建大模型审核效果评估体系与测试数据集,通过评测与AB测试持续优化策略效果,降低误判与漏判,推动审核能力稳定提升
3. 审核规则建模与合规对齐: 将平台审核标准、内容安全政策及监管要求转化为结构化策略,确保大模型输出的一致性、可解释性与合规性
4. 知识库建设与模型增强(RAG): 建设内容安全审核知识库,沉淀规则、案例与边界样本,并结合检索增强(RAG)提升复杂场景下的审核效果与泛化能力
5. 策略资产沉淀与复用: 沉淀典型误判/漏判案例与最佳实践,形成可复用的策略与数据资产,支撑多业务场景规模化应用