扎实的机器技术基础,了解前沿的AI技术,有不错的工程实践经验优先
2、熟悉模型推理加速的研究和技术进展,包括但不限于模型量化、剪枝、算子优化等
3、了解业界常用的大语言模型推理加速框架,如SGLang,vLLM,TensorRT-LLM等
4、有CUDA开发经验,熟悉TensorRT/Triton/Cutlass经验者优先
5、熟悉LLM模型训练优化,了解混合精度训练、分布式训练等训练加速方法优先
6、有大模型训练优化经验,熟悉FSDP/DeepSpeed/Megatron等分布式训练框架经验者优先
训练/推理优化满足一条即可