硕士及以上学历,数学、计算机、自动化、电子等专业优先
掌握扩散模型原理和压缩加速手段(如: 步数蒸馏,包括CM / Score-Distillation ), 具备公式推导和证明能力, 有过相关的研究经历和实践经验者优化
有过使用 DPO / LoRA 等技术对模型进行轻量微调者优先
熟练掌握线性线数, 概率论, 信息论, 凸优化等基础知识,了解矩阵论, 随机过程等
精通PyTorch, 熟练大模型并行框架的使用(如: DeepSpeed / Megatron)
精通Python, 掌握Triton和C++, 了解CUDA或有实践经验者优先