Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Meituan logo
美团
基座大模型算法研究员 (Post-training)
立即应聘

基座大模型算法研究员 (Post-training)

发布于 2 天前

普通员工/个人贡献者

北京市
高级经验
全职员工
仅现场办公
博士
PyTorch
强化学习
自然语言处理
模型优化
分布式训练
大模型
RLHF
指令微调

AI 估算 · 40k–60k

大模型算法研究员,北京,硕士/博士,美团大厂,薪资有竞争力。

职位详情

关于这个职位

该职位是美团基础研发平台的核心算法岗,专注于大模型后训练阶段(Post-training)

你将参与LongCat模型的基础能力优化,包括指令遵循、推理、智能体等,并探索大规模RL及多目标RL训练方案,推动模型能力持续提升
团队人才密度高,算力充足,适合有志于大模型前沿技术的研究型人才

最低要求

对大模型开发流程有深入认知,熟悉预训练、指令微调、RL等流程与框架

具备扎实的算法和数学理论基础及良好的编程基础,熟悉自然语言处理、生成式AI和机器学习等技术,熟悉Python、Java等至少一种编程语言,熟悉PyTorch等深度学习框架,对技术开发及应用有热情
目标感强,善于分析和发现问题,拆解简化,有想法并乐于挑战自我,能够从日常工作中发现新的空间
条理性强且有推动力,能够梳理繁杂的工作并建立有效机制,推动上下游配合完成目标

工作职责

深度参与LongCat模型基础能力优化,包括但不限于指令遵循、幻觉、推理、智能体等

探索大规模RL及多目标RL的训练方案,与上下游团队合作,构建长期稳定的RL Scaling训练能力,推动模型能力持续提升
探索Long Horizon场景下大模型的优化方案,包括不限于数据合成、上下文管理、长上下文RL方案等

AI 洞察

优缺点分析

优点

  • 前沿技术栈:深度参与大规模RL、超长上下文等业界最新技术,接触到美团海量数据和超大规模集群
  • 顶尖团队氛围:团队人才密度高,有众多博士和顶会论文产出者,扁平化管理,交流学习机会多
  • 充足资源支持:拥有大规模分布式训练环境和丰富数据资源,为研究落地提供坚实保障
  • 职业发展助力:完善的互联网学习生态圈,重视底层逻辑和方法论,有助于非线性成长
  • 技术门槛高:需要同时掌握大模型、强化学习、分布式训练等多领域知识,学习曲线陡峭
  • 竞争激烈:团队汇聚顶尖人才,内部考核严格,需持续产出高质量成果

缺点 / 挑战

  • 工作强度较大:互联网大厂核心算法岗,项目周期紧,可能有较大工作压力
  • 适合有大模型或强化学习背景的技术牛人,渴望挑战前沿技术、追求学术影响力且能适应高强度研发节奏的求职者

角色解读

  • 技术专家路线:在RL Scaling、长上下文等方向深耕,成为领域权威,产出顶级论文和开源项目
  • 技术管理路线:随着团队扩张,可晋升为技术负责人或小组长,带领团队攻克大模型核心技术难题
  • 跨领域发展:积累大模型底层能力后,可转向应用层模型落地、AI产品架构等方向,拓宽职业边界
  • 负责大模型后训练阶段的基础能力优化,如指令遵循、推理能力提升,涉及幻觉、智能体等前沿课题
  • 探索大规模强化学习(RL)及多目标RL训练方案,与团队共同构建稳定可扩展的RL Scaling训练基础设施
  • 针对超长上下文场景,研究数据合成、上下文管理和长上下文RL优化方法,推动模型在复杂任务上的表现
  • 深入掌握大模型开发流程,包括预训练、指令微调、强化学习等全链路技术
  • 扎实的算法和数学功底,精通自然语言处理、生成式AI和机器学习,熟练使用PyTorch等深度学习框架
  • 具备优秀的编程能力(Python/Java),能够高效实现和调试复杂算法
  • 目标导向,善于拆解问题并推动协作,能从日常工作中发现创新空间

申请策略

  • 深入了解美团大模型业务方向:关注LongCat模型的技术博客和开源项目,面试时展现对岗位的热情和匹配度
  • 准备一个完整的项目案例:从问题定义、技术选型到落地效果,展示解决复杂问题的能力和思考深度
  • 突出大模型相关项目经历:详细描述在预训练、指令微调、RLHF等环节的具体贡献和成果(如模型指标提升、论文发表等)
  • 展示算法与工程能力:列出精通的语言和框架(Python、PyTorch),强调大规模分布式训练经验(如使用Megatron、DeepSpeed等)
  • 体现创新潜力:附上在ICLR、NeurIPS等顶会发表的论文或开源项目,证明研究能力和技术视野
  • 强调团队协作和推动力:用实例说明如何协调上下游资源达成目标,体现条理性和执行力
  • 系统学习强化学习:重点掌握PPO、GRPO等RL算法,理解RL Scaling的理论与实践
  • 熟悉长上下文技术:了解RoPE、FlashAttention、位置编码等,阅读相关文献

面试指南

  • STAR法则:描述情境(S)、任务(T)、行动(A)、结果(R),突出个人贡献和思考
  • 对比分析:在回答技术问题时,先阐述主流方法(如PPO),再提出自己的改进或创新点,展示深度
  • 结构化表达:先总后分,给出结论再展开细节,体现逻辑性和条理性
  • 请详细解释你参与过的大模型后训练流程,包括数据构建、模型训练和评估方法?
  • 谈谈你对RL Scaling(如PPO、DPO)的理解,以及如何解决训练中不稳定的问题?
  • 如何处理长上下文场景下的模型困惑度下降和注意力分散问题?你有何优化思路?
  • 描述一次你在大规模分布式训练中遇到的错误或性能瓶颈,以及如何调试和解决的?
  • 你如何看待当前大模型在幻觉和推理能力上的局限?未来的改进方向是什么?

匹配度报告

72
综合匹配度

美团核心算法岗,顶尖团队+前沿技术+充足资源,但工作强度大,WLB一般。

适合人群
适合极度看重技术成长和前沿探索,愿意投入高强度工作以换取快速进步的发展型人才。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展95
工作生活40
使命价值70

薪资福利匹配

85较高

美团作为上市大厂,薪资福利具有竞争力,算法岗位薪资水平在行业内属于偏高区间,但未在JD中披露具体福利。

薪资信号未披露(AI估算:40K-60K/月)

成长发展匹配

95较高

该职位聚焦大模型最前沿的RL Scaling和长上下文技术,团队学术氛围浓厚,有充足算力和数据支持,成长空间极大。

技术前沿前沿/新兴技术
技术栈大模型、强化学习、RL Scaling、长上下文、分布式训练、PyTorch、Transformer、Natural Language Processing
成长机会团队扁平、人才密度高、北斗计划、博士员工比例高、顶会发表论文
业务类型profit_center

工作生活匹配

40较低

JD未提及WLB相关福利,算法核心岗通常工作强度较大,属于典型互联网研发节奏,生活化动机满足度有限。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值匹配

70中等

大模型技术处于科技前沿,对行业有变革性影响,但美团主业为零售+科技,算法研究偏向业务赋能,社会意义中性。

行业发展高速增长赛道
社会影响中性/一般
使命信号驱动技术发展、创造行业价值
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

美团 的其他在招职位

  • 客服大模型工具运营

    美团 · 北京市
    AI 估算 · 20k-35k
  • HR实习生-招聘方向

    美团 · 北京市
    AI 估算 · 4k-6k
  • 仓储主管

    美团 · 南京市
    AI 估算 · 12k-18k
  • 生产主管-快驴白云

    美团 · 广州市
    AI 估算 · 10k-16k
  • 运输主管

    美团 · 长沙市
    AI 估算 · 12k-18k

相似职位推荐

  • AI研发创新(实习生)

    中国移动 · 银川市
    AI 估算 · 3k-5k
  • Business R&D Senior Professional

    日立能源 · 重庆市
    AI 估算 · 20k-35k
  • Business R&D Entry Professional

    日立能源 · 合肥市
    AI 估算 · 15k-30k
  • Business R&D Senior Professional

    日立能源 · 重庆市
    AI 估算 · 20k-35k
  • 大模型算法工程师

    京东 · 北京市
    AI 估算 · 35k-65k

美团 的其他在招职位

  • 客服大模型工具运营

    美团 · 北京市
    AI 估算 · 20k-35k
  • HR实习生-招聘方向

    美团 · 北京市
    AI 估算 · 4k-6k
  • 仓储主管

    美团 · 南京市
    AI 估算 · 12k-18k
  • 生产主管-快驴白云

    美团 · 广州市
    AI 估算 · 10k-16k
  • 运输主管

    美团 · 长沙市
    AI 估算 · 12k-18k

相似职位推荐

  • AI研发创新(实习生)

    中国移动 · 银川市
    AI 估算 · 3k-5k
  • Business R&D Senior Professional

    日立能源 · 重庆市
    AI 估算 · 20k-35k
  • Business R&D Entry Professional

    日立能源 · 合肥市
    AI 估算 · 15k-30k
  • Business R&D Senior Professional

    日立能源 · 重庆市
    AI 估算 · 20k-35k
  • 大模型算法工程师

    京东 · 北京市
    AI 估算 · 35k-65k