优化训练集群的训练效率,解决通信延迟、显存溢出、Checkpoint保存慢等问题
搭建稳定的数据加载与预处理Pipeline,确保算法团队能高效迭代大模型
运用AI Coding工具重构车端通信、控制链路代码,开发自动化日志分析与异常诊断系统,显著缩短问题定位时间,提升功能开发效率
构建高可靠的车云数据通道,支撑模型OTA升级、影子模式数据回流及远程诊断,优化弱网环境下的传输策略与数据压缩方案
实施量化(AWQ/GPTQ/FP8)、KV Cache、投机采样等压缩方案,优化大模型在车端芯片的内存占用与推理延迟,实现ViT-LLM高效协同及图像特征缓存