对大模型加速优化方案有深入了解,对投机采样,GQA,MOE,Lora量化等技术有开发与优化经验者优先
有TFlite (Micro),NCNN,SNPE/QNN,EAI,NeuroPilot等移动端深度学习框架开发经验者优先
熟悉神经网络模型的定点优化,熟悉各类嵌入式平台芯片架构及底层指令,有ARM Neon、Hexagon DSP、Cadence Hifi3/5、RISC-V等平台的算子开发及算法调优经验者优先
有相关领域高质量会议/期刊论文,或深度参与过开源深度学习框架的开发并有相应贡献者优先