负责字节跳动国际化直播业务中的多模态、计算机视觉、自然语言处理的算法工作,探索内容理解技术在各业务中的应用落地,实现业务指标的增长与技术创新
探索前沿多模态技术研究,结合业务的需求,持续优化算法助力业务增长,具体的技术方向包括但不限于:
1)多模态预训练,多模态检索
2)多标签视频/文本分类,直播高光识别
3)多模态大模型/大语言模型SFT/Continue Training
4)多模态和推荐模型的结合
5)多模态的开集(Few/Zero-shot)识别
负责算法的工程部署和应用落地:
1)深入直播推荐业务,利用内容理解技术帮助直播推荐在实时推荐、互动生态、直播创作、兴趣探索、多样性等方向上做的更好
2)承接直播平台的识别需求,健全直播生态各个维度的内容理解体系,做好直播内容的准确理解