负责VLA、VLN模型训练的高质量数据集构建,搭建真机数据采集、仿真测试、数据生成及数据处理全流程体系
基于动作捕捉服、VR设备等遥操作数采系统,制定人形机器人真机数据采集规范,构建数据采集链路,保障多模态联动数据质量
搭建多场景仿真环境、设计核心任务,实现人工及自动化数据采集,探索仿真数据增强方法,补充真机数据短板
搭建数据处理流程,完成原始数据清洗、打标、增强及数据可视化等处理,输出符合模型训练标准的高质量数据集
建立数据质量评估体系,结合模型反馈优化数据策略,跟踪前沿技术并落地应用
探索生成世界模型、UMI等技术方法,生成多样化多模态数据,解决稀缺场景数据缺失问题,探索Sim2Real问题的解决
联动算法、硬件、工程团队,理解模型对数据的敏感点,快速迭代采集策略,让机器人学得更快、更聪明