美团的【北斗】视觉生成基座和交互式视频研究员薪资是多少？

该职位薪资范围为 35k–60k（人民币/月）。

【北斗】视觉生成基座和交互式视频研究员的工作地点在哪里？

该职位工作地点位于北京市。工作形式为仅现场办公。

美团的【北斗】视觉生成基座和交互式视频研究员有什么任职要求？

该职位要求硕士学历及高级经验工作经验。

美团

【北斗】视觉生成基座和交互式视频研究员

立即应聘

【北斗】视觉生成基座和交互式视频研究员

发布于大约 2 个月前

普通员工/个人贡献者

北京市

高级经验

全职员工

仅现场办公

硕士

研究与开发 (研发)

多模态大模型

实时交互

扩散模型

视频生成

AIGC

MoE

PyTorch

VAE

自回归生成

AI 估算 · 35k–60k

美团头部大厂，视频生成研究员岗位稀缺，技术前沿，薪资具备竞争力。

职位详情

关于这个职位

该职位是美团视觉AI基础模型团队的核心研究员角色，专注于视频生成基座模型和交互式视频世界模型的前沿探索

你将参与构建PB级视频数据管线，研究高效率VAE、统一生成模型架构、实时交互视频生成等技术，直接推动数字世界与物理世界的视觉技术落地

适合对扩散模型、大规模分布式训练有深厚积累，渴望在AIGC和交互式生成领域做出顶级成果的研究型人才

最低要求

熟悉扩散模型、VAE等相关研究进展

熟悉PyTorch，有充分的动手实践经验

工作职责

高效率、低损失、高压缩比的图像视频VAE和tokenizer

图像、视频、音视频统一生成模型的架构、训练和推理探索，包括稀疏架构、大尺寸MoE、自回归生成等

功能模型，包括参考生成、长视频生成、流式实时视频生成、音视频生成等

实时交互视频世界模型的长时空一致性、动态性和交互控制能力增强，以及在可交互视频、虚拟人实时交互场景的应用

优先资格

有图像/视频生成、多模态大模型相关研究和实习经历，有影响力的开源项目中做出过核心贡献

发表过高水平论文（如ICLR、CVPR、ICCV等），有相关竞赛经历并取得名次

AI 洞察

优缺点分析

优点

研究方向前沿且爆发力强，视频生成和世界模型是AI下一阶段核心赛道
美团提供PB级视频数据和超大规模算力，能积累稀缺的系统级经验
团队技术氛围浓厚，与资深研究员和优秀同学共事，成长快速
研究周期较长，从模型设计到落地需要持续迭代和耐心
适合对视频生成和交互式AI有强烈兴趣，具备扎实研究能力和工程动手能力，渴望在顶级平台做出有影响力成果的博士或资深硕士

缺点 / 挑战

技术挑战极高，需要同时理解多种前沿模型架构且能动手实现

角色解读

技术深耕：从研究员成长为视频生成领域的顶级专家，主导技术方向
管理发展：可向技术Leader转型，带领团队攻克复杂问题
业务影响：研究成果直接落地美团本地生活场景，实现技术到产品的闭环
设计和训练高效率的图像视频VAE及tokenizer，优化压缩比与重建质量
探索视频生成模型的稀疏架构、MoE、自回归等前沿架构，提升模型效果与效率
研究实时交互视频世界模型，增强长时空一致性和动态交互控制能力
扎实的扩散模型、VAE理论功底，能独立复现和改进SOTA方法
熟练使用PyTorch，具备分布式训练和模型优化实战经验
熟悉多模态生成、大模型训练，了解MoE、自回归等架构

申请策略

准备好自己的研究总结和技术博客，面试时能清晰阐述技术思路
突出扩散模型、VAE相关的项目经历，最好有开源贡献或论文发表
强调大规模分布式训练的经验，如PB级数据处理、多卡并行等
展示任何视频生成、多模态大模型的实际成果，如Demo、代码仓库
补充MoE、自回归生成等最新架构的学习，阅读相关论文并复现代码
提前了解美团本地生活业务场景，思考视觉技术如何赋能

面试指南

从问题定义、现有方法分析、你的创新点、实验结果和局限性方面进行结构化阐述
先明确评价指标和核心难点，然后比较不同方案的优劣，最后给出你的选择理由
请详细介绍一下你参与的扩散模型相关工作，你在其中承担了什么角色？
如何设计一个高效的视频VAE？有哪些关键trade-off？
MoE在生成模型中的应用有哪些挑战？如何解决负载均衡问题？
实时视频生成对模型架构和推理系统有哪些特殊要求？
你如何看待视频生成模型在本地生活场景中的潜在应用？
复习扩散模型、VAE、Transformer、MoE等核心论文，特别是近两年的CVPR/ICCV/NeurIPS

职位点评

综合评分

美团前沿视觉研究岗，顶级技术成长+较高社会价值，但工作强度大且面议薪资。

从薪资福利、成长空间、工作节奏和岗位方向综合评估，方便横向比较。

更适合这类人

适合极度重视技术成长和前沿探索，能接受高强度工作，但对WLB要求不高的求职者。

表现最好

成长发展

相对薄弱

工作生活

薪资福利70

成长发展95

工作生活40

使命价值85

薪资福利

70中等

美团作为上市大厂，薪资福利有竞争力，但该岗位属于前沿研究，薪资面议，且未明确列出福利。

薪资信号面议 (35K-60K/月)

成长发展

95较高

岗位描述突出前沿技术、超大规模模型经验、顶尖团队，成长路径清晰，是极佳的发展机会。

技术前沿前沿/新兴技术

技术栈扩散模型、VAE、MoE、自回归生成、视频生成、世界模型

成长机会极具前沿性和爆发力的研究方向、全链路系统级积累、顶尖团队，快速成长

业务类型ambiguous

工作生活

40较低

未提及远程或弹性办公，作为大厂核心研发岗，可能工作强度较大，办公地点为北京核心地段。

工作模式仅现场办公

办公地点市区核心地段

加班情况未提及（无法判断）

使命价值

85较高

岗位致力于构建物理世界与数字世界的视觉引擎，让连接更智能，具有正向社会影响，且属于高速增长赛道。

行业发展高速增长赛道

社会影响正向社会影响力较高

使命信号让每一次连接更智能、让物理世界的烟火气更美好

创新程度开拓性创新（行业首创）

美团的其他在招职位

相似职位推荐

Watch Jobs

【北斗】视觉生成基座和交互式视频研究员

职位详情

关于这个职位

最低要求

工作职责

优先资格

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

Keeta-商业分析师（经营分析）-卡塔尔

服务治理高级产品经理

食杂零售综合分析

内容传播实习生（内容编辑与设计方向）

分析应用平台研发工程师

萤石网络-穿戴健康算法工程师-智能手表-杭州

音频与传感-光学系统专家-光谱/气体传感-杭州

海康消防-算法工程师-杭州

Scientific Principal, Aerospace

Patent Information Analyst with chemical background

美团的其他在招职位

Keeta-商业分析师（经营分析）-卡塔尔

服务治理高级产品经理

食杂零售综合分析

内容传播实习生（内容编辑与设计方向）

分析应用平台研发工程师

相似职位推荐

萤石网络-穿戴健康算法工程师-智能手表-杭州

音频与传感-光学系统专家-光谱/气体传感-杭州

海康消防-算法工程师-杭州

Scientific Principal, Aerospace

Patent Information Analyst with chemical background

【北斗】视觉生成基座和交互式视频研究员

职位详情

关于这个职位

最低要求

工作职责

优先资格

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

美团 的其他在招职位

Keeta-商业分析师（经营分析）-卡塔尔

服务治理高级产品经理

食杂零售综合分析

内容传播实习生（内容编辑与设计方向）

分析应用平台研发工程师

相似职位推荐

萤石网络-穿戴健康算法工程师-智能手表-杭州

音频与传感-光学系统专家-光谱/气体传感-杭州

海康消防-算法工程师-杭州

Scientific Principal, Aerospace

Patent Information Analyst with chemical background

美团的其他在招职位