深度参与过业界主流视觉基础模型或多模态大模型的研发工作,系统理解整体技术架构与训练方法
精通大规模模型训练范式,包括预训练(Pretraining)、监督微调(SFT)、多任务联合训练、蒸馏训练、后训练(如 RLHF/DPO 等),理解训练稳定性及效率优化方法
熟悉视觉核心任务中的一种或多种,包括目标检测、分割、图片理解或视觉语言模型(VLM)等方向,熟悉 VLM for Grounding
具备大规模数据构建与治理经验,熟悉自动标注、弱监督学习、数据蒸馏等技术路线
在计算机视觉或机器学习领域的国际顶级会议或期刊(如CVPR/ICCV/ECCV/NeurIPS/ICLR等)发表过高质量论文,在权威竞赛或开源项目中有核心贡献者优先
具备扎实的工程实现能力,熟练使用Python/PyTorch进行模型开发,熟悉分布式训练框架
具备C/C++或推理优化经验(TensorRT/ONNX/CUDA)者优先