前沿算法研究:引领多模态AI算法的前沿探索,包括但不限于音频理解、视频理解、音视频融合等技术的创新与突破
结合飞书场景的需求抽象和定义音视频技术方向(如:全模态说话人识别、音视频结构化等),让全模态音视频理解能力在智能会议场景和飞书知识问答场景落地
模型优化:主导大规模多模态模型的Posttrain和部署工作,在准确性、效率和资源消耗之间达到最优平衡
解决方案设计:针对复杂业务场景设计端到端的多模态AI解决方案,解决行业痛点问题
产品赋能:深度参与产品策略制定,将前沿多模态技术转化为具有商业价值的产品能力,在会议智能化、知识问答、文档协作等场景实现技术突破
跨团队协作:与产品、工程等团队深度协作,推动AI技术在产品中的深度应用