Agent攻击与防御研究:参与Agent安全攻击库建设,设计红蓝对抗测试用例
研究Prompt注入、提示泄露等手法
设计并实现高风险行为监控、拦截和防御策略
核心安全能力研发:开发Skill静态安全扫描引擎,支持Python、Node.js等语言
构建MCP协议安全审计模块,校验tool调用合法性和参数合规性
研发Data-in-Transit和Data-at-Rest的敏感数据识别与脱敏能力
安全沙箱与风险评分:参与资源限制、网络白名单等安全沙箱能力建设
研发Agent行为归因与风险评分模型,生成安全报告和风险矩阵图
实现自动化风险评估和漏洞验证流程