【留用实习】大模型AI Infra底软/硬件加速工程师

🤖 AI 估测:¥8K-12K

发布时间:1 天前

立即应聘

ℹ️关于这个职位

该职位是快手大模型AI Infra团队的留用实习岗,专注于视频生成/多模态大模型在最新硬件平台上的训练与推理性能优化
你将深入GPU底层架构,编写高性能CUDA kernel,并参与大规模分布式系统的稳定性提升
适合对AI系统优化有浓厚兴趣、具备扎实编程和算法基础的硕士或博士同学

工作职责

负责视频生成大模型/多模态大模型在最新硬件平台上的训练/推理性能分析与优化,目标达成该硬件平台上的极限性能
负责分析并提升大规模分布式训练系统的集群性能,完成对大规模训练任务故障的根因定位与稳定性提升

最低要求

掌握Python/C++编程语言,熟练使用Pytorch训练框架或SGlang/vLLM等大模型推理框架
掌握大模型领域基础算法知识,熟悉常规Transformer/SD模型结构,以及对应的常用性能优化方法
深刻理解GPU硬件体系结构,能熟练编写高性能cuda kernel

👍优先资格

有分布式大模型训练框架(Megatron/FSDP)或分布式推理引擎开发经验者优先
有在超节点硬件环境上,做过训练/推理性能优化者优先
有GPU高性能算子库(Cutlass/Cute、PTX、汇编)、集合通信库(xCCL)、AI编译器(XLA/Dynamo)开发经验者优先