负责视频生成基础模型的架构创新与迭代优化,深入研究扩散模型、Transformer、GAN、VAE、视频时序建模、多模态对齐等核心技术
独立搭建视频生成模型训练 pipeline,完成大规模视频数据集的清洗、预处理、特征提取与高效加载
优化训练策略
参与视频生成领域高质量数据集的构建、筛选与增强方案设计,结合业务场景搭建专属数据闭环
针对视频生成模型推理速度慢、显存占用高的痛点,开展模型压缩、量化、剪枝、蒸馏、算子优化、推理引擎适配等工作
持续跟踪CV、多模态、生成式AI领域顶会前沿技术与行业标杆方案,完成技术调研、复现与落地验证