本科以上学历,计算机、电子或自动化等相关专业,5年以上开发经验
熟悉arm/x86/riscv等架构,至少熟悉一种主流SoC(Qualcomm,NXP,TI,Nvidia,etc.)
熟练使用Linux下各种性能分析工具,如perf,ftrace,top,mpstat等等,分析监控用户态和内核态程序发现性能瓶颈,并进行优化
熟悉内核关键模块,如进程调度,内存管理,文件系统,中断管理,网络子系统等,精通三个模块以上
熟悉各类硬件加速平台,如GPU,NPU,DSP,ARM NEON等
熟悉CUDA及TensorRT,以及常用的推理框架
熟练使用GPU性能调优工具(Nsight Systems,Nsight Compute等),具备GPU性能瓶颈分析及优化的能力