负责具身智能数据平台的搭建与开发,构建覆盖采集、处理、标注、质检全链路的自动化数据管线,支撑大规模机器人学习数据的高效生产
研发基于三维重建的场景与物体数字化技术(如 NeRF、3D Gaussian Splatting、MVS 等),构建高保真三维资产库,为仿真环境与合成数据生成提供基础数据支撑
开发人体与手部运动建模系统,涵盖全身动作捕捉、灵巧手姿态估计、人手-物体交互重建等,将人类示范数据高效转化为机器人可用的训练数据
设计并实现自动化/半自动化标注系统,结合视觉基础模型(SAM、GroundingDINO 等)与主动学习策略,实现操作任务中关键语义信息(动作分割、接触检测、物体状态等)的高效标注
搭建多模态数据采集系统,集成多视角相机、深度传感器、力/触觉传感器、动捕设备等,设计标准化采集流程,保障数据质量与一致性
建立数据质量评估与治理体系,开发数据清洗、去重、平衡、增强等工具,构建面向机器人操作任务的高质量 benchmark 数据集
与算法团队紧密协作,根据模型训练需求(VLA、World Model、RL 等)定义数据规格,推动数据驱动的算法迭代闭环