Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/小红书/Hi Lab-【Ace顶尖实习生】全模态实时交互大模型研究(语音方向)
Xiaohongshu logo
X
小红书 (Xiaohongshu)

职位信息

上海市 / 北京市 / 浙江省-杭州市
无经验要求
实习生
仅现场办公
本科
实习/见习

标签

机器学习深度学习算法LLM语音处理多模态大模型实时交互
💡

核心评价

顶尖AI Lab实习,前沿技术探索,高成长潜力,薪资符合实习生水准,工作模式为现场办公。

Hi Lab-【Ace顶尖实习生】全模态实时交互大模型研究(语音方向)

🤖 AI 估测:¥6K-12K

发布时间:29 天前

立即应聘

ℹ️关于这个职位

这是一个专注于全模态实时交互大模型研究的实习岗位,方向为语音
你将参与设计并验证一种融合视觉、语音流、思考模态与SOTA LLM的实时交互架构,旨在解决现有模型在实时对话中的延迟、打断等问题,目标是实现即时、流畅且富有智慧的多模态自然语音对话

✓工作职责

工作职责 尽管当前的多模态大模型(融合视觉、语音、文本)已展现出强大的感知与理解潜力,但是在实时交互场景中,由于模型设计导致的高延迟、生硬的轮次状态、频繁的打断或被打断严重影响信息传递效率
同时多个模态无法实时融合也限制了多模态模型在语音交互场景下的深度应用
生成的交互内容有时显得冗长、缺乏提炼或智能不足,这些问题限制了用户与大模型实时交流的体验
本课题的目标是设计并验证一种全模态实时交互的大模型架构,将视觉模态、语音流模态、思考模态信息以及 SOTA LLM 进行实时融合
从而使得大模型可以与人进行即时、流畅、且深入浅出、富有智慧的多模态自然语音对话

⭐最低要求

不限年级,本科及以上在读,计算机/人工智能/软件工程等相关专业优先
优秀的代码能力、数据结构和基础算法功底,熟练掌握至少一门编程语言,包括但不限于Python等
良好的沟通协作能力,责任心强,积极主动,能和团队一起探索新技术,推进技术进步

👍优先资格

有语音/视频等多模态大模型理解技术背景,或大规模模型训练实际项目经验者优先
在ICASSP/Interspeech/ASRU/TPAMI/CVPR/NeurIPS/ICCV/ICML/ICLR/ACL等顶级期刊会议上发表相关论文者优先
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

小红书 的其他在招职位

  • AI产品运营实习生

    小红书

    上海市 · 仅现场办公

  • 点点AI运营实习生 · AI图像创作

    小红书

    上海市 · 仅现场办公

  • AI Agent算法工程师

    小红书

    北京市 · 仅现场办公

  • 【27届实习】OLAP研发工程师

    小红书

    北京市 · 仅现场办公

  • 【27届实习】Ray研发工程师

    小红书

    北京市 · 仅现场办公

相似职位推荐

  • 多模态实习生

    叠纸游戏

    上海市 · 仅现场办公

  • 大模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 图形图像算法实习生

    叠纸游戏

    图形图像算法实习生 · 仅现场办公

  • 算法工程师(武汉)

    多点数智

    武汉市 · 仅现场办公

  • 算法工程师(北京)

    多点数智

    北京市 · 仅现场办公