Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/美团/【大模型北斗实习】多模态融合及多模态实时交互算法研究
Meituan logo
M
美团 (Meituan)

职位信息

北京市
初级经验
实习生
仅现场办公
学历未注明
实习/见习

标签

PyTorchDeepSpeed多模态融合自监督学习Megatron多模态大语言模型 (Mllm)多模态表征对齐对比学习
💡

核心评价

技术前沿的大厂AI实习,成长价值极高,WLB预期一般。

【大模型北斗实习】多模态融合及多模态实时交互算法研究

🤖 AI 估测:¥8K-15K

发布时间:26 天前

立即应聘

ℹ️关于这个职位

这是一个专注于多模态大语言模型(MLLM)前沿研究的实习岗位
你将参与多模态表征对齐、知识迁移、融合框架以及实时交互等核心算法研究,旨在构建能够理解和生成文本、图像、音频、视频任意组合的全模态智能系统
这是一个深入AI前沿、提升研究与实践能力的绝佳机会

✓工作职责

研究方向包括不限于:
1) 多模态表征高效对齐研究:研究如何在统一模型架构下提取并共享视觉、语音、语言等模态的特征
探索基于对比学习、自监督学习的方法,优化多模态对齐过程
针对视频、音频等数据,研究时间序列信息的对齐技巧
2) 多模态知识迁移与涌现能力研究:研究知识在不同模态间的迁移规律,激发模型在跨模态任务中的涌现能力,实现对未见任务的泛化
3) 多模态融合:探索统一的全模态大模型框架,研究高效全模态预训练技术,探索跨模态数据上的scaling law和智能涌现能力
使之能够高效处理文本、音频、图像和视频输入的任意组合,并生成涵盖文本、音频和图像等多种模态的输出
4) 实时多模态交互:探索高效的多模态智能交互技术,增强系统在多模场景下的智能,提升人机实时音视频交互体验

⭐最低要求

1)对CV、NLP、语音等多模态相关领域有深入的理解,在其中一个或多个方向有深入的研究经历,且有相关实际项目经验
2)熟练使用深度学习框架(比如PyTorch),熟悉 Megatron、DeepSpeed 等开源训练框架

👍优先资格

1)在知名开源项目中有核心贡献者优先
2)对多模态大模型有深入研究且有实际训练经验者优先
3)发表过高水平论文,如 ICLR、NeurIPS、ICML、CVPR 等
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

美团 的其他在招职位

  • 招聘负责人

    美团

    上海市 · 仅现场办公

  • Operations Data Analyst Intern

    美团

    北京市 · 仅现场办公

  • 广州经营主管

    美团

    佛山市 · 仅现场办公

  • 核心本地商业招聘经理-上海

    美团

    上海市 · 仅现场办公

  • 生产主管

    美团

    广州市 · 仅现场办公

相似职位推荐

  • 多模态实习生

    叠纸游戏

    上海市 · 仅现场办公

  • 大模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 图形图像算法实习生

    叠纸游戏

    图形图像算法实习生 · 仅现场办公

  • 算法工程师(武汉)

    多点数智

    武汉市 · 仅现场办公

  • 算法工程师(北京)

    多点数智

    北京市 · 仅现场办公