软硬件接口定义与验证:参与自研芯片的指令集和编程模型设计,基于模拟器或FPGA平台完成接口功能验证,确保软硬件交互的正确性与一致性
2.编译与算子优化:基于MLIR/TVM等编译框架,实现深度学习算子到自研指令集的高效映射
通过算子融合、指令流水线调度、内存访问优化等策略,提升芯片算力利用率与执行效率
3.性能分析与建模:构建系统级性能分析模型,结合指令级模拟器、周期精确模拟器及FPGA原型验证平台,构建多维度性能画像
定位AI负载在指令发射、访存带宽、多核同步等方面的瓶颈,形成性能归因与架构改进建议
4.软硬协同设计:参与芯片功能验证与性能评估,从系统架构视角提出微架构改进建议,驱动软硬件接口的迭代优化