深入理解计算机体系结构、编译原理,熟练C/C++,理解典型互联网业务(微服务、AI、大数据、搜索广告、编解码、存储等)
熟悉服务器芯片架构与相关IP及协议(Core、SNoC、DDRC、SoC),具备PPA及能效优化意识与实践
具备Workload分析、Tracing及切片经验,理解SimPoint,掌握应用Trace提取与仿真分析
熟练使用仿真建模与性能评估工具链(QEMU/GEM5/NVMain/SystemC等),熟悉业界开源Benchmark
能完成典型应用的功耗画像与拆解,支撑TDP或典型场景的定义与优化,理解并善用DVFS、Turbo、功率封顶机制,量化其对性能、能效与稳定性的影响并实现闭环改进
具备系统性能分析与调优能力,熟悉PMU/PEBS/LBR/PT、Roofline/Top-down、VTune/Perf/DynamoRIO等