优秀的代码能力、数据结构和基础算法功底,熟悉C++开发,有分布式系统或高性能计算相关开发经验(存储、并发、网络)
有一线互联网公司有参数服务器或大规模稀疏模型推理系统研发经历,深入理解并拥有大规模参数服务和分布式系统的实践经验,熟悉其架构、一致性协议与性能调优
参与推理/训练参数服务器的迭代优化,优化GPU PS embedding 相关功能,包括不限于参数更新 / 存储 / 索引构建等模块升级与运维
熟悉高性能网络技术(RDMA、RoCE、DPDK)及内核旁路优化,有异构计算(GPU/XPU)在参数服务器中应用的经验,对搜推广检索系统和模型有深入了解
熟悉至少一种主流的深度学习训练或推理框架(TensorFlow / PyTorch / Onnx / TensorRT等)的原理和实现