美团的【大模型北斗实习】多模态融合及多模态实时交互算法研究薪资是多少？

该职位薪资范围为 8k–15k（人民币/月）。

【大模型北斗实习】多模态融合及多模态实时交互算法研究的工作地点在哪里？

该职位工作地点位于北京市。工作形式为仅现场办公。

该职位要求学历未注明学历及初级经验工作经验。

🤖 AI 估测：¥8K-15K

发布时间：26 天前

这是一个专注于多模态大语言模型（MLLM）前沿研究的实习岗位

你将参与多模态表征对齐、知识迁移、融合框架以及实时交互等核心算法研究，旨在构建能够理解和生成文本、图像、音频、视频任意组合的全模态智能系统

这是一个深入AI前沿、提升研究与实践能力的绝佳机会

研究方向包括不限于：

1) 多模态表征高效对齐研究：研究如何在统一模型架构下提取并共享视觉、语音、语言等模态的特征

探索基于对比学习、自监督学习的方法，优化多模态对齐过程

针对视频、音频等数据，研究时间序列信息的对齐技巧

2) 多模态知识迁移与涌现能力研究：研究知识在不同模态间的迁移规律，激发模型在跨模态任务中的涌现能力，实现对未见任务的泛化

3) 多模态融合：探索统一的全模态大模型框架，研究高效全模态预训练技术，探索跨模态数据上的scaling law和智能涌现能力

使之能够高效处理文本、音频、图像和视频输入的任意组合，并生成涵盖文本、音频和图像等多种模态的输出

4）实时多模态交互：探索高效的多模态智能交互技术，增强系统在多模场景下的智能，提升人机实时音视频交互体验

1）对CV、NLP、语音等多模态相关领域有深入的理解，在其中一个或多个方向有深入的研究经历，且有相关实际项目经验

2）熟练使用深度学习框架（比如PyTorch），熟悉 Megatron、DeepSpeed 等开源训练框架

1）在知名开源项目中有核心贡献者优先

2）对多模态大模型有深入研究且有实际训练经验者优先

3）发表过高水平论文，如 ICLR、NeurIPS、ICML、CVPR 等

【大模型北斗实习】多模态融合及多模态实时交互算法研究

🤖 AI 估测：¥8K-15K

发布时间：26 天前