安全策略设计与落地: 深入分析AI游戏、UGC等业务场景,识别潜在的内容与交互风险
产出严谨的策略文档,明确定义不同场景下的安全标准与AI行为规范,并建立可量化的安全指标体系
模型对齐与数据治理: 主导制定并迭代安全数据标注规范,为标注团队提供清晰、可执行的指引
负责对标注数据进行质量审核与反馈,建立闭环优化机制,确保用于模型训练(SFT/RLHF)的数据源头高质量、高一致性
风险监控与应急响应: 建立并维护风险监控体系,通过数据分析主动发现潜在的安全问题与策略漏洞
作为问题响应的核心推动者,负责组织跨团队资源,进行根因分析,并推动解决方案的快速落地
策略平台化建设: 抽象多场景下的共性安全需求,主导安全策略平台化建设,将通用安全能力抽象为可复用、可配置的模块化服务,提升整体安全策略的部署效率与一致性
行业洞察与前瞻研究: 持续追踪全球生成式AI的安全技术、合规政策与行业最佳实践,进行前瞻性研究,并转化为对内可落地的策略建议与风险预警