负责构建和优化面向动作生成的多模态大模型架构,探索文本、视觉信号、3D 动作序列等模态的深度融合与对齐
负责研究多模态场景下,高维、连续3D动作数据的Tokenization 方法
负责探索多模态动作大模型 Scaling Law,包括数据量、参数量级、计算量等,通过模型规模化提升生成能力
负责探索多模态对齐大模型,支持语音、文本、动作等多模态对齐,未来进一步支持多模态实时输出
负责探索任意角色动画生成,可对任意角色与骨架均能生成自然的动画
负责探索、研发动捕精修大模型,可对动捕过程各类噪声自动去除,达到精修品质
负责探索环境感知的交互动画生成,支持角色与物体、场景、其他角色的交互,确保生成交互动作的合理性