字节跳动的多模态大模型算法专家（音视频理解方向）-飞书AI薪资是多少？

该职位薪资范围为 55k–90k（人民币/月）。

多模态大模型算法专家（音视频理解方向）-飞书AI的工作地点在哪里？

该职位工作地点位于上海市。工作形式为仅现场办公。

该职位要求硕士学历及专家级经验工作经验。

🤖 AI 估测：¥55K-90K

发布时间：大约 1 个月前

这是一个专注于多模态大模型算法研发的高级技术岗位，核心方向是音视频理解

你将负责从算法研究、模型优化到产品落地的全流程工作，致力于将前沿的多模态AI技术（如音频理解、视频理解、音视频融合）应用于飞书的智能会议和知识问答等核心场景，解决实际业务问题并创造商业价值

前沿算法研究：引领多模态AI算法的前沿探索，包括但不限于音频理解、视频理解、音视频融合等技术的创新与突破

结合飞书场景的需求抽象和定义音视频技术方向（如：全模态说话人识别、音视频结构化等），让全模态音视频理解能力在智能会议场景和飞书知识问答场景落地

模型优化：主导大规模多模态模型的Posttrain和部署工作，在准确性、效率和资源消耗之间达到最优平衡

解决方案设计：针对复杂业务场景设计端到端的多模态AI解决方案，解决行业痛点问题

产品赋能：深度参与产品策略制定，将前沿多模态技术转化为具有商业价值的产品能力，在会议智能化、知识问答、文档协作等场景实现技术突破

跨团队协作：与产品、工程等团队深度协作，推动AI技术在产品中的深度应用

硕士及以上学位，计算机科学、人工智能、机器学习等相关专业优先，博士学位背景优先

具备多模态/跨模态AI领域深入的研究经验，具备从0到1构建多模态系统的完整经历

在CVPR、ICCV、ECCV、ICASSP等顶级会议发表过高质量论文，或在相关领域有重要开源贡献

有多模态AI产品化落地经验，熟悉从算法研究到产品交付的全流程

对多模态AI的发展趋势有深刻洞察，能够前瞻性地识别和布局关键技术方向

具备技术团队管理经验，能够指导和培养算法工程师，推动团队技术能力快速提升

加分项：

业界影响力：在多模态AI领域有一定知名度，如担任顶级会议审稿人、程序委员会成员等

创新成果：拥有多模态AI相关专利或核心算法贡献

多模态大模型算法专家（音视频理解方向）-飞书AI

🤖 AI 估测：¥55K-90K

发布时间：大约 1 个月前