熟悉Linux开发环境,掌握Python/C++等语言,具备良好的编程基础以及系统设计能力
熟悉GPU或SIMD编程体系架构,了解LLM、AIGC等模型结构,能够使用nvpro、nsys等profiler工具
精通主流训练推理框架和加速技术,包括但不限于:Pytorch、Megatron、DeepSpeed、VLLM、Sglang等
具有系统性分析模型性能瓶颈的能力,熟悉从算子调用,到模型训练推理,再到结果返回的功能定义和具体逻辑
具备良好的技术热情和责任感,优秀的分析解决问题能力、良好的团队意识和沟通能力