热爱编程,精通C++/Python,精通CUDA 编程
具有独立开发能力,精通计算机体系结构,有汇编级别开发经验,对AI算法和主流框架有丰富的应用或开发经验
了解FlashAttention、PagedAttention、MoE、Chunked Prefill 等大模型核心技术
了解常见的大模型量化算法(如AWQ、GPTQ、SmoothQuant 等)及量化算子的实现
了解大模型通信算子(如Allreduce 等)及计算通信 overlap 实现
有分离式部署(PD 分离)开发经验
软素质:
目标驱动,并有探索精神
团队协作及沟通能力
具备分析和解决问题的能力
有极强的学习能力和知识迁移能力