熟悉NLP类模型训练场景,有GPT,LlaMa、DeepSeek等相关知识和经验者优先
熟悉视觉类,多模态大模型训练场景,有ViT, Swin Transformer, Stable Diffusion, MoE相关知识和经验者优先
熟悉Megatron, Deepspeed, Colossal AI, FSDP等分布式框架,有相关知识、使用和调优经验者优先
熟悉以下推理框架者优先,如FasterTransformer、vllm、sglang、LMDeploy、TensorRT-LLM等
熟悉PyTorch分布式场景,有二次开发经验,系统调优知识和经验者优先
熟悉集合通信原理和基本知识,对NCCL有大规模使用,调优经验者优先
熟悉算子开发流程,有CUDA编程知识和相关经验者优先
熟悉NV GPU架构,对其他类型AI芯片有使用经验者优先