计算机及相关专业本科以上学历,3 年以上高性能系统或 AI Infra 研发经验
精通 C/C++,具备扎实的系统底层能力(内存、并发、网络),代码风格优雅,热衷技术分享
深入理解至少一种主流训练/推理框架(XDL、TFRA、DeepRec、TorchRec、DeepSpeed、veRL、Megatron 等),对其执行模型与性能瓶颈有源码级洞察
熟悉 TensorFlow Serving、TensorRT、OpenXLA、ONNX Runtime 等推理后端,具备大模型量化、编译优化与线上 A/B 调优实战经验
了解推荐/广告典型模型(DeepFM、DIEN、SIM、OneRec、RankMixer 等),熟悉样本生成→训练→上线→推理→特征服务的完整链路
有 GPU/TPU 集群建设与性能调优经验,熟练使用 CUDA、cuDNN、TensorRT 等工具,能够定位并解决分布式环境中的复杂性能瓶颈