Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Meituan logo
美团
【北斗】视觉生成基座和交互式视频研究员
立即应聘

【北斗】视觉生成基座和交互式视频研究员

发布于 大约 3 小时前

普通员工/个人贡献者

北京市
高级经验
全职员工
仅现场办公
硕士
研究与开发 (研发)
PyTorch
视频生成
扩散模型
AIGC
多模态大模型
VAE
MoE
实时交互
自回归生成

AI 估算 · 35k–60k

美团头部大厂,视频生成研究员岗位稀缺,技术前沿,薪资具备竞争力。

职位详情

关于这个职位

该职位是美团视觉AI基础模型团队的核心研究员角色,专注于视频生成基座模型和交互式视频世界模型的前沿探索

你将参与构建PB级视频数据管线,研究高效率VAE、统一生成模型架构、实时交互视频生成等技术,直接推动数字世界与物理世界的视觉技术落地
适合对扩散模型、大规模分布式训练有深厚积累,渴望在AIGC和交互式生成领域做出顶级成果的研究型人才

最低要求

熟悉扩散模型、VAE等相关研究进展

熟悉PyTorch,有充分的动手实践经验

工作职责

高效率、低损失、高压缩比的图像视频VAE和tokenizer

图像、视频、音视频统一生成模型的架构、训练和推理探索,包括稀疏架构、大尺寸MoE、自回归生成等
功能模型,包括参考生成、长视频生成、流式实时视频生成、音视频生成等
实时交互视频世界模型的长时空一致性、动态性和交互控制能力增强,以及在可交互视频、虚拟人实时交互场景的应用

优先资格

有图像/视频生成、多模态大模型相关研究和实习经历,有影响力的开源项目中做出过核心贡献

发表过高水平论文(如ICLR、CVPR、ICCV等),有相关竞赛经历并取得名次

AI 洞察

优缺点分析

优点

  • 研究方向前沿且爆发力强,视频生成和世界模型是AI下一阶段核心赛道
  • 美团提供PB级视频数据和超大规模算力,能积累稀缺的系统级经验
  • 团队技术氛围浓厚,与资深研究员和优秀同学共事,成长快速
  • 研究周期较长,从模型设计到落地需要持续迭代和耐心
  • 适合对视频生成和交互式AI有强烈兴趣,具备扎实研究能力和工程动手能力,渴望在顶级平台做出有影响力成果的博士或资深硕士

缺点 / 挑战

  • 技术挑战极高,需要同时理解多种前沿模型架构且能动手实现

角色解读

  • 技术深耕:从研究员成长为视频生成领域的顶级专家,主导技术方向
  • 管理发展:可向技术Leader转型,带领团队攻克复杂问题
  • 业务影响:研究成果直接落地美团本地生活场景,实现技术到产品的闭环
  • 设计和训练高效率的图像视频VAE及tokenizer,优化压缩比与重建质量
  • 探索视频生成模型的稀疏架构、MoE、自回归等前沿架构,提升模型效果与效率
  • 研究实时交互视频世界模型,增强长时空一致性和动态交互控制能力
  • 扎实的扩散模型、VAE理论功底,能独立复现和改进SOTA方法
  • 熟练使用PyTorch,具备分布式训练和模型优化实战经验
  • 熟悉多模态生成、大模型训练,了解MoE、自回归等架构

申请策略

  • 准备好自己的研究总结和技术博客,面试时能清晰阐述技术思路
  • 突出扩散模型、VAE相关的项目经历,最好有开源贡献或论文发表
  • 强调大规模分布式训练的经验,如PB级数据处理、多卡并行等
  • 展示任何视频生成、多模态大模型的实际成果,如Demo、代码仓库
  • 补充MoE、自回归生成等最新架构的学习,阅读相关论文并复现代码
  • 提前了解美团本地生活业务场景,思考视觉技术如何赋能

面试指南

  • 从问题定义、现有方法分析、你的创新点、实验结果和局限性方面进行结构化阐述
  • 先明确评价指标和核心难点,然后比较不同方案的优劣,最后给出你的选择理由
  • 请详细介绍一下你参与的扩散模型相关工作,你在其中承担了什么角色?
  • 如何设计一个高效的视频VAE?有哪些关键trade-off?
  • MoE在生成模型中的应用有哪些挑战?如何解决负载均衡问题?
  • 实时视频生成对模型架构和推理系统有哪些特殊要求?
  • 你如何看待视频生成模型在本地生活场景中的潜在应用?
  • 复习扩散模型、VAE、Transformer、MoE等核心论文,特别是近两年的CVPR/ICCV/NeurIPS

匹配度报告

72
综合匹配度

美团前沿视觉研究岗,顶级技术成长+较高社会价值,但工作强度大且面议薪资。

适合人群
适合极度重视技术成长和前沿探索,能接受高强度工作,但对WLB要求不高的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利70
成长发展95
工作生活40
使命价值85

薪资福利匹配

70中等

美团作为上市大厂,薪资福利有竞争力,但该岗位属于前沿研究,薪资面议,且未明确列出福利。

薪资信号面议 (35K-60K/月)

成长发展匹配

95较高

岗位描述突出前沿技术、超大规模模型经验、顶尖团队,成长路径清晰,是极佳的发展机会。

技术前沿前沿/新兴技术
技术栈扩散模型、VAE、MoE、自回归生成、视频生成、世界模型
成长机会极具前沿性和爆发力的研究方向、全链路系统级积累、顶尖团队,快速成长
业务类型ambiguous

工作生活匹配

40较低

未提及远程或弹性办公,作为大厂核心研发岗,可能工作强度较大,办公地点为北京核心地段。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

85较高

岗位致力于构建物理世界与数字世界的视觉引擎,让连接更智能,具有正向社会影响,且属于高速增长赛道。

行业发展高速增长赛道
社会影响正向社会影响力较高
使命信号让每一次连接更智能、让物理世界的烟火气更美好
创新程度开拓性创新(行业首创)
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

美团 的其他在招职位

  • 设备主管

    美团 · 成都市
    AI 估算 · 12k-20k
  • 生产主管-广州番禺RDC

    美团 · 广州市
    AI 估算 · 10k-18k
  • 门店经营分析师

    美团 · 北京市
    AI 估算 · 18k-28k
  • 【LongCat大模型人才校招】多模态交互算法研究员

    美团 · 北京市
    AI 估算 · 25k-40k
  • 物流规划工程实施

    美团 · 北京市
    AI 估算 · 15k-25k

相似职位推荐

  • 全域安全集成工程师-汽车专项-实习

    小米 · 南京市
    AI 估算 · 3k-5k
  • 仿真虚拟标定工程师-汽车专项-实习

    小米 · 南京市
    AI 估算 · 4k-6k
  • 产品安全风险管理工程师-汽车专项-实习

    小米 · 南京市
    AI 估算 · 4k-6k
  • 整车功能开发工程师-汽车专项-实习

    小米 · 南京市
    AI 估算 · 3k-5k
  • 整车架构与集成工程师-汽车专项-实习

    小米 · 南京市
    AI 估算 · 4k-6k

美团 的其他在招职位

  • 设备主管

    美团 · 成都市
    AI 估算 · 12k-20k
  • 生产主管-广州番禺RDC

    美团 · 广州市
    AI 估算 · 10k-18k
  • 门店经营分析师

    美团 · 北京市
    AI 估算 · 18k-28k
  • 【LongCat大模型人才校招】多模态交互算法研究员

    美团 · 北京市
    AI 估算 · 25k-40k
  • 物流规划工程实施

    美团 · 北京市
    AI 估算 · 15k-25k

相似职位推荐

  • 全域安全集成工程师-汽车专项-实习

    小米 · 南京市
    AI 估算 · 3k-5k
  • 仿真虚拟标定工程师-汽车专项-实习

    小米 · 南京市
    AI 估算 · 4k-6k
  • 产品安全风险管理工程师-汽车专项-实习

    小米 · 南京市
    AI 估算 · 4k-6k
  • 整车功能开发工程师-汽车专项-实习

    小米 · 南京市
    AI 估算 · 3k-5k
  • 整车架构与集成工程师-汽车专项-实习

    小米 · 南京市
    AI 估算 · 4k-6k