美团的【基座大模型北斗实习】多模态大模型基座前沿探索与应用薪资是多少？

该职位薪资范围为 8k–15k（人民币/月）。

【基座大模型北斗实习】多模态大模型基座前沿探索与应用的工作地点在哪里？

该职位工作地点位于北京市。工作形式为仅现场办公。

该职位要求硕士学历及无经验要求工作经验。

🤖 AI 估测：¥8K-15K

发布时间：22 天前

这是一个专注于多模态大模型基座前沿探索的实习岗位

你将参与探索多模态大模型（融合视觉、语言、语音）的统一架构、训练范式与数据体系，旨在突破模型能力上限，实现跨模态的深度理解与高质量生成

工作内容涉及视频多模态能力提升、视觉基座表征优化以及理解与生成任务的统一研究

多模态大模型基座：探索并不断突破多模态基座模型的能力上限

具体地，负责大模型相关技术前沿探索，包括但不限于融合模型架构探索、原生训练范式探索、高效训推框架探索等，不断提升模型的理解能力、生成质量、多样性、可控性等

负责不同规模、不同结构的多模态模型的数据准备和优化，构建多模态数据处理流程等

视频多模态能力提升：负责解决多模态视频大模型领域的前沿技术难题，如视频后训练、长视频时序理解、音视频等，探索短视频、长视频、视频流等不同形态的视频多模态方案，探究图像、视频统一的多模态解决方案

视觉基座表征能力提升：面向不同的多模态架构和训练范式，从视觉基座的角度深入探索视觉连续表征和离散表征的联系和区别，负责探索更具通用性的多模态视觉特征，生产行业内领先的视觉基座

多模态理解生成统一：负责多模态理解与生成的前沿探索与研究，包括但不限于视觉表征统一训练、多模态统一架构探索、理解与生成任务关系研究

硕士及以上学历，计算机、人工智能、自动化、数学、自然语言处理等相关专业，博士优先

在以下一个或多个领域有较深入的研究或实践经验：多模态大模型（MLLM）、全模态融合大模型（Omni-LLM），视觉基座（Vision-Model）、理解生成统一（Unified-MM）、强化学习（RL）

具备扎实的算法和数学理论基础及良好的编程基础，熟悉PyTorch等深度学习框架

在大模型领域有研究基础，或参与过有影响力的开源项目，在ICLR/NeurIPS/ICML/ACL等顶会发表论文者优先

有良好的沟通协作能力，对追求前沿技术有强烈热情，能够与团队融洽合作，快速试验想法

博士学历优先

在大模型领域有研究基础，或参与过有影响力的开源项目，在ICLR/NeurIPS/ICML/ACL等顶会发表论文者优先

【基座大模型北斗实习】多模态大模型基座前沿探索与应用

🤖 AI 估测：¥8K-15K

发布时间：22 天前