diffusion步数蒸馏和CFG蒸馏: 1)跟进学术界最前沿的 few-steps diffusion 算法, 探索研发 one-step / few-steps 的无损蒸馏算法, 包括但不限于 consistency modeling、shortcut、score distillation等方案, 打造实时化的极致高效视频/图像大模型
2)研究 DPO/GRPO/PPO 等强化学习的手段在少步模型下的新训练算法, 摸索强化学习与压缩算法的化学反应, 推动效果-效率的帕雷托前沿新SOTA
transformer模型架构优化: 1)跟进学术界高效attn 计算成果(包括但不限于: sparse-attn, linear-attn 等), 探索研究视频模态下较full-attn 的无损高效attn方案
2)量化后训练: 探索极低bit 的量化训练(QAT), 特别是针对FP8/FP4 的无损量化加速