Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Meituan logo
美团
LongCat - 多模态算法研究员
立即应聘

LongCat - 多模态算法研究员

发布于 大约 14 小时前

普通员工/个人贡献者

北京市
高级经验
全职员工
仅现场办公
学历未注明
深度学习
PyTorch
强化学习
自然语言处理
计算机视觉
多模态学习
DeepSpeed
数据pipeline
Megatron
大规模预训练

AI 估算 · 35k–60k

美团核心研发岗位,多模态前沿方向,技术难度高,薪资具有竞争力,参考大厂高级算法工程师薪资。

职位详情

关于这个职位

这个职位是美团基础研发平台的多模态算法研究员,专注于探索下一代原生多模态基础模型

你将参与从数据挖掘到模型训练的全链路研发,包括视觉表征设计、多模态融合策略、大规模预训练等
团队资源充沛,提供大规模GPU集群,适合对多模态AI前沿技术有热情的研究人员

最低要求

熟悉 Python,熟练使用 PyTorch/Megatron/DeepSpeed 等训练框架,有大规模预训练或数据 pipeline 开发经验

满足以下至少一项: · 有大规模多模态数据挖掘/清洗/质量控制的工程经验
· 对视觉表征设计、多模融合策略、生成范式等有深入理解,有从0到1探索新方向的经验

工作职责

探索下一代原生多模态基础模型:让模型不止于接入视觉能力,而是能够统一建模文本、图像、视频与交互过程,像理解文字一样理解视觉世界,并在真实物理场景中进行推理、生成和行动

我们将重点探索统一的多模态表征体系,包括离散视觉 token、连续视觉表征及其混合形式,使图像与视频能够被基础模型高效学习、组合和生成
你将参与以下方向中的一个或多个:
研究多模态与文本模态的深度融合策略,包括 early fusion 架构设计、多模态 / 文本数据配比优化、多模态上下文建模等,实现视觉能力与语言能力的协同提升
从互联网及业务场景中大规模挖掘、清洗和构建高质量多模态训练数据,覆盖图文交错、视频、网页、文档、GUI、代码和交互轨迹等数据形态,支撑模型在 browser use、复杂文档理解、vision-to-code 等生产力场景的能力突破
设计兼顾理解、重建与生成的视觉表征体系,包括离散视觉 tokenizer、多尺度视觉 token、视频 tokenization 以及连续 / 离散混合表征
基于理解与生成统一的表征,规模化构建图文交错、视频序列等多模态自监督预训练数据,解锁新的多模态智能维度
基于理解与生成统一的模型能力,探索长程、多轮的多模态生成与交互任务,通过端到端强化学习激发模型的自我评估和迭代修正能力
进一步探索未来帧预测、状态建模和交互轨迹学习在物理视觉世界中的推理、规划与行动能力

AI 洞察

优缺点分析

优点

  • 团队技术实力强,资源充沛(大规模 GPU 集群),可做前沿探索
  • 涉及全链路研发,从数据到模型到后训练,技能成长全面
  • 美团业务场景丰富,研究成果易于落地,有实际影响力
  • 多模态基础模型研究难度大,需要深厚的技术积累和创新突破
  • 对工程能力要求高,需要处理大规模数据和分布式训练
  • 适合对多模态 AI 有强烈热情、具备扎实深度学习基础和工程能力的研究型人才,尤其是喜欢从0到1探索新方向的人

缺点 / 挑战

  • 工作强度可能较高,需要持续跟踪前沿论文并快速实验

角色解读

  • 在多模态 AI 前沿领域深耕,成为算法专家或首席科学家
  • 横向扩展到其他多模态场景(如机器人、自动驾驶),或向技术管理岗位发展
  • 依托美团业务场景,将研究成果落地为产品,获得业务与技术双重成长
  • 探索下一代原生多模态基础模型,统一建模文本、图像、视频与交互过程
  • 研究多模态与文本模态的深度融合策略,包括 early fusion 架构设计和数据配比优化
  • 大规模挖掘、清洗和构建高质量多模态训练数据,支撑各类生产力场景
  • 设计视觉表征体系(如离散视觉 tokenizer),并探索多模态生成与交互任务
  • 熟悉 Python 和深度学习框架(PyTorch/Megatron/DeepSpeed),有大模型预训练经验
  • 具备大规模多模态数据处理或视觉表征设计的深入经验
  • 对多模态融合策略、生成范式有深入理解,能从0到1探索新方向

申请策略

  • 关注美团的“零售+科技”战略,思考多模态技术如何提升本地生活服务体验
  • 在面试中准备一个完整的多模态项目案例,从数据到模型到效果评估
  • 突出大规模预训练或数据 pipeline 开发经验,特别是多模态相关
  • 强调视觉表征设计或多模态融合方面的研究成果(论文或开源项目)
  • 展示使用 PyTorch/Megatron/DeepSpeed 进行分布式训练的经验
  • 补充多模态数据清洗和质量管理的最佳实践
  • 深入理解视觉 tokenizer 和生成范式(如 VQVAE、Diffusion)
  • 熟悉强化学习在生成模型中的应用(如 RLHF、GRPO)

面试指南

  • 用 STAR 法则分项目背景、任务、行动、结果,突出关键贡献
  • 比较不同技术方案的 trade-off,体现系统思考和工程化能力
  • 结合最新论文和业界实践,展示技术洞察力
  • 请描述你的一个多模态预训练项目,包括数据处理、模型架构和训练策略
  • 如何设计一个统一的多模态表征?离散 vs 连续表征的优缺点?
  • 在 multi-modal fusion 中,early fusion 和 late fusion 各有什么优劣?
  • 如何构建高质量的多模态训练数据?数据清洗的难点和解决方案?
  • 你如何看待基于强化学习优化多模态生成模型?有什么实际案例?

匹配度报告

69
综合匹配度

大厂核心研发,前沿多模态技术,资源充足,成长空间大,但工作强度未知。

适合人群
适合追求技术成长和前沿探索、不太在意WLB的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利75
成长发展90
工作生活40
使命价值70

薪资福利匹配

75中等

薪资水平有竞争力(大厂+前沿方向),但未明确具体薪资和福利,评估为中等偏上。

薪资信号未披露(AI估算:35K-60K/月)

成长发展匹配

90较高

全链路研发参与、前沿技术探索、资源充沛,成长空间巨大。

技术前沿前沿/新兴技术
技术栈多模态学习、视觉tokenizer、大规模预训练、Megatron、DeepSpeed、强化学习
成长机会互联网学习生态圈、非线性成长
业务类型ambiguous

工作生活匹配

40较低

工作地点固定北京,未提及弹性办公或WLB,互联网大厂工作强度通常较大。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值匹配

70中等

属于AI前沿赛道,有行业影响潜力,但未强调直接社会价值。

行业发展高速增长赛道
社会影响中性/一般
使命信号创造行业价值
创新程度开拓性创新(行业首创)
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

美团 的其他在招职位

  • 政府投诉调解(驻所A)

    美团 · 北京市
    AI 估算 · 8k-15k
  • 商家端产品运营

    美团 · 北京市
    AI 估算 · 18k-30k
  • 用户体验调研运营(NPS方向)

    美团 · 北京市
    AI 估算 · 18k-28k
  • 充电宝-下沉战区-销售BD(渤海区域-保定、廊坊、烟台、威海、张家口、吉林、邯郸、潍坊、东营、太原)

    美团 · 保定市
    AI 估算 · 6k-15k
  • 视频拍摄及制作项目实习(客户案例&产品方向)

    美团 · 北京市
    AI 估算 · 4k-7k

相似职位推荐

  • 大模型评测算法工程师-AI数据与安全

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 大模型评测算法工程师-AI数据与安全

    字节跳动 · 深圳市
    AI 估算 · 25k-45k
  • 智能系统评估研究科学家-Commercial AI

    字节跳动 · 北京市
    AI 估算 · 35k-65k
  • 视觉感知算法工程师-PICO

    字节跳动 · 北京市
    AI 估算 · 30k-45k
  • 番茄模型运维(模型开发方向)运营-CQC

    字节跳动 · 北京市
    AI 估算 · 30k-50k

美团 的其他在招职位

  • 政府投诉调解(驻所A)

    美团 · 北京市
    AI 估算 · 8k-15k
  • 商家端产品运营

    美团 · 北京市
    AI 估算 · 18k-30k
  • 用户体验调研运营(NPS方向)

    美团 · 北京市
    AI 估算 · 18k-28k
  • 充电宝-下沉战区-销售BD(渤海区域-保定、廊坊、烟台、威海、张家口、吉林、邯郸、潍坊、东营、太原)

    美团 · 保定市
    AI 估算 · 6k-15k
  • 视频拍摄及制作项目实习(客户案例&产品方向)

    美团 · 北京市
    AI 估算 · 4k-7k

相似职位推荐

  • 大模型评测算法工程师-AI数据与安全

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 大模型评测算法工程师-AI数据与安全

    字节跳动 · 深圳市
    AI 估算 · 25k-45k
  • 智能系统评估研究科学家-Commercial AI

    字节跳动 · 北京市
    AI 估算 · 35k-65k
  • 视觉感知算法工程师-PICO

    字节跳动 · 北京市
    AI 估算 · 30k-45k
  • 番茄模型运维(模型开发方向)运营-CQC

    字节跳动 · 北京市
    AI 估算 · 30k-50k