具备较强的工程能力,熟悉C/C++/Python,熟悉tensorflow/pytorch/onnx主流AI框架
深入了解常见的LLM大模型,例如GPT、BERT、LLAMA等,理解内部模型结构原理和优化方法,具备相应的实践经验
具备在CUDA/cuDNN/TensorRT/nccl等高性能库上实现和优化高性能算子的开发经验
熟悉并行/异构计算体系结构,熟悉CPU/GPU/NPU/TPU等主流XPU架构和编程模型优先
良好的团队沟通能力、技术攻关能力,能独立思考和解决问题,责任心强,工程师素养佳