负责将各类主流AI模型(如CNN、Transformer、LLM、VLM等)部署到机器人端侧芯片,并进行极致的性能调优
深入理解芯片硬件架构(如NPU、GPU、DSP等),利用其特性(如稀疏计算、专用指令集)实现模型的高效推理,显著提升推理速度和能效比
主导并实施模型的量化(INT8/INT4/混合精度)、剪枝、蒸馏等压缩技术,在保证模型精度损失可控的前提下,大幅降低模型体积和计算开销
跟踪业界最新的模型架构(如LLM, VLM)和端侧加速技术,探索其在机器人场景下的应用可行性,并解决落地过程中的核心技术难题