本科及以上学历,4年以上工作经验,熟悉计算机体系架构,具备较好的并行计算基础,熟悉ARM/X86等指令集
熟悉至少一种异构计算框架,包括但不限于OpenCL / Metal / NEON / CUDA,有移动端推理框架开发或使用经验
具备端侧 NN 模型跨平台适配与优化经验,并有成功解决因平台或芯片差异引发的性能及精度的挑战
熟悉端侧模型的性能与精度优化,具备 FP16 / INT8 等量化及调优经验,能够在性能、精度与稳定性之间实现合理平衡
能独立定位并解决端侧推理中的瓶颈问题,包括但不限于延迟 / 内存占用 / 吞吐量等,能够制定有效的加速或回退策略
具备扎实的工程实现能力,熟练掌握至少一种端侧开发语言(C++、Swift、Kotlin 或 Java),能够与客户端及渲染开发团队协作完成模型集成