负责构建与优化内容安全基准评测体系,设计并执行系统性评测方案,结合AI生成内容特点与风险模式,开展针对大模型业务的内容安全攻防测试与效果评估,挖掘防护体系薄弱环节,推动策略持续优化
主导内容安全策略变更的全流程卡控与效果验证,建立从评测设计、执行到结果复盘的标准化机制,推动评测流程嵌入产品策略迭代主线,实现评测运营规模化与闭环管理
研究新型违规内容特征与传播机制,基于业务场景与产品逻辑构建风险用例库,为内容安全策略的制定与迭代提供数据与决策支持
协同策略、产品、研发及运营团队,推动评测发现的风险问题落地改进,建立长效追踪机制,对内容安全核心指标负责,持续提升整体风险治理效能与产品安全体验