计算机/人工智能/数学等相关专业,本科及以上学历
熟练掌握 Python 及常用数据结构,具备扎实的算法底子与优秀的工程实现能力
熟悉主流深度学习框架(PyTorch),具备大规模分布式训练(如 DeepSpeed, Megatron, FSDP)的实操、调参及系统性的踩坑经验
掌握主流生成式视觉算法与基础理论:深刻理解 Diffusion Models(扩散模型)、Transformer/DiT 架构原理,熟悉主流图像/视频生成算法及底座
具备极强的数据敏感度,熟悉多模态大模型(如 Qwen-VL, GPT-4o 等)的应用,对复杂真实场景数据的提纯、清洗规则设计和 Prompt 体系构建有实战经验
强烈的工程落地导向,关注生成内容的逼真程度、动态细节及物理合理性,熟悉相关质量指标(如 FVD, 运动平滑度评估),能独立解析和修改前沿开源代码
具备快速学习能力与良好的沟通协作能力,有技术极客精神