美团的【基座大模型北斗实习】视觉生成与世界模型技术研究薪资是多少？

该职位薪资范围为 8k–15k（人民币/月）。

【基座大模型北斗实习】视觉生成与世界模型技术研究的工作地点在哪里？

该职位工作地点位于北京市。工作形式为仅现场办公。

该职位要求学历未注明学历及初级经验工作经验。

🤖 AI 估测：¥8K-15K

发布时间：22 天前

这是一个专注于视觉生成与世界模型前沿技术研究的实习岗位

你将参与高效率图像视频处理、统一生成模型架构、功能模型（如长视频生成）以及世界模型在具身智能等场景的应用探索

这是一个深入AI生成领域核心，接触美团基座大模型项目的机会

参与视觉生成与世界模型方向的前沿研究，可根据个人背景和研究兴趣选择以下方向之一深入推进：

高效率、低损失、高压缩比的图像视频 VAE 和 tokenizer 研究

统一生成模型的架构、训练与推理探索（稀疏架构、大尺寸 MoE、自回归生成等）

功能模型研究，包括参考生成、长视频生成、流式实时视频生成、音视频生成等

隐式世界模型、WorldActionModel 及 Action-conditioned WorldModel 的方法研究

世界模型在具身智能、实时交互等场景中的应用探索

其他你坚信路线正确的视觉生成与世界模型前沿方向

熟悉扩散模型、VAE等相关研究进展

熟悉PyTorch，有充分的动手实践经验

有图像/视频生成、Video-based世界模型相关研究和实习经历，有影响力的开源项目中做出过核心贡献

发表过高水平论文（如ICLR、CVPR、ICCV等），有相关竞赛经历并取得名次

【基座大模型北斗实习】视觉生成与世界模型技术研究

🤖 AI 估测：¥8K-15K

发布时间：22 天前