扎实的机器技术基础,了解前沿的AI技术,发表过高水平学术会议论文或者有竞赛经验者优先
熟悉多模态大模型工作优先,包括但不限于Llava,Mini-Gemini,Qwen-VL,Shikra等
在多媒体和计算机视觉某个领域有较深入的研究,包括但不限于:图像搜索、图像/视频分类和识别、图像分割、目标检测、图文多模态模型、和视频文本多模态模型等
有CV/多模态大模型相关项目经验优先
研发&优化电商视频&商品多模态大模型,结合LLM和视频/商品表征,支持视频多模态分类,视频QA,跨模态检索,商品分类等任务,显著超越线上模型
有较强的实践能力,在Kaggle,COCO,ImageNet,ActivityNet等比赛获奖者优先
有顶级学术会议(如CVPR、ICCV、ECCV等)发表论文者优先