负责视频内容安全场景下的多模态大模型研发,包括基座预训练、指令微调(SFT)、强化学习(RLHF)等核心技术探索
主导内容安全场景中的Few-shot/Zero-shot策略设计,推动模型在复杂审核和风险识别任务中的泛化能力与鲁棒性
设计并优化端到端的内容审核体系,构建高召回、高准确的风险识别、排序与召回模型
推动数据驱动的模型优化,包括复杂风险的Chain-of-Thought标注框架、强化学习数据挖掘与对齐训练
跟踪前沿研究成果(如NeurIPS,ICLR,CVPR,ACL等),将最新技术引入业务落地并形成突破
在团队中发挥技术领军作用,指导核心研发工作,推动跨团队协作与技术标准化