Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Meituan logo
美团
【LongCat实习】LongCat 大模型研究员-Post-training
立即应聘

【LongCat实习】LongCat 大模型研究员-Post-training

发布于 大约 11 小时前

实习/见习

北京市
无经验要求
实习生
仅现场办公
学历未注明
研究与开发 (研发)
深度学习
PyTorch
强化学习
自然语言处理
生成式AI
分布式训练
大模型
RLHF
Post-Training

AI 估算 · 5k–10k

北京大模型方向实习薪资有竞争力,技术前沿,人才需求大,参考美团标准。

职位详情

关于这个职位

该实习岗位加入美团核心本地商业基础研发平台,参与大语言模型后训练(Post-training)方向的前沿研究

你将专注于指令遵循、复杂推理、强化学习等关键技术的优化,突破大规模RL训练稳定性问题,推动模型在真实场景中的深度思考与可靠行动
团队人才密度高,拥有充足算力和丰富数据资源,有机会在ICLR/NeurIPS等顶会发表论文

最低要求

来自全球高校计算机科学、人工智能、数学、物理或相关领域

在大模型领域有研究基础,或参与过有影响力的开源项目,在ICLR/NeurIPS/ICML/ACL等顶会发表论文
具备扎实的算法和数学理论基础及良好的编程基础,熟悉自然语言处理、生成式AI和机器学习等技术,对技术开发及应用有热情

工作职责

大模型核心基础能力优化:围绕指令遵循、幻觉缓解、复杂推理、智能体规划等关键能力,研究并开发高效的后训练与对齐方案

深入分析模型行为,通过数据策略、奖励建模、训练范式创新等,系统性提升模型的可靠性与实用性
大规模强化学习与多目标RL训练:研究大规模强化学习(RL)及多目标强化学习的训练方案,突破RL在超大模型上的训练稳定性与扩展性问题
构建可长期演进、稳定高效的RL Scaling训练管线,从算法、系统、数据等多维度推动模型能力持续提升
长周期场景下的复杂推理与工具调用:聚焦Long Horizon任务中的多步推理、工具使用与自主智能体能力,设计并实现前沿优化方案
探索包括高质量数据合成、长上下文管理、长上下文强化学习、过程监督、搜索与规划结合等关键技术,提升模型在复杂真实场景下的表现

优先资格

目标感强,善于分析和发现问题,拆解简化,有想法并乐于挑战自我,能够从日常工作中发现新的空间

条理性强且有推动力,能够梳理繁杂的工作并建立有效机制,推动上下游配合完成目标
在程序设计竞赛,如ACM/ICPC、Topcoder和Codeforces等,取得优异成绩者优先

AI 洞察

优缺点分析

优点

  • 接触最前沿的大模型后训练技术,团队学术氛围浓厚
  • 充足算力资源和丰富数据,支持大规模实验
  • 高人才密度团队,可与顶尖同事交流,发表顶会论文机会大
  • 参与核心研发,对职业发展有很高含金量
  • 工作节奏可能较快,需要快速学习和产出
  • 实习期有限,需在短时间内融入并贡献
  • 适合有较强学术背景(如顶会论文或竞赛经历)、热爱大模型研究、希望在真实业务场景中验证技术的同学

缺点 / 挑战

  • 门槛较高,需要扎实的研究背景和编程能力

角色解读

  • 可转向大模型研究员或算法工程师,专注前沿技术研发
  • 表现优异可获转正机会,在美团内部继续成长
  • 积累顶会论文发表经验,为学术深造或业界发展奠定基础
  • 研究大模型后训练技术,通过数据优化和大规模RL提升模型核心能力
  • 负责RL pipeline的开发和优化,解决大规模训练的稳定性问题
  • 深入分析模型行为,设计数据策略和奖励模型,系统性提升模型可靠性
  • 探索长周期任务中的多步推理、工具调用等前沿方案
  • 扎实的机器学习和NLP基础,熟悉生成式AI和深度学习
  • 优秀的编程能力,掌握Python和PyTorch等框架
  • 了解强化学习与RLHF原理,有相关项目经验
  • 较强的分析和问题解决能力,具备科研思维

申请策略

  • 提前了解美团技术博客和团队成果,展示对公司的兴趣
  • 在求职信中表达对Post-training方向的理解和热情
  • 突出顶会论文、开源项目或相关研究经历
  • 强调RL和NLP项目经验,特别是RLHF或对齐相关工作
  • 展示编程和算法竞赛成绩(如ACM/ICPC)
  • 体现对技术的热情和自我驱动力
  • 补充强化学习理论知识,熟悉PPO、DPO等算法
  • 动手实现一个小型RLHF项目,积累工程经验

面试指南

  • 从问题定义、现有方法、你的创新点、实验验证、结果分析等结构回答
  • 强调自己的思考和贡献,展示逻辑清晰和分析能力
  • 结合理论知识和实践经验,具体说明遇到的困难和解决方案
  • 请解释RLHF的训练流程和挑战
  • 如何处理强化学习训练中的不稳定问题?
  • 设计一个评估模型指令跟随能力的实验
  • 如何缓解大模型的幻觉现象?
  • 你参与过的相关项目中最具挑战的部分是什么?

职位点评

68
综合评分

美团核心研发实习,前沿大模型技术,发展机会极佳,但薪资和WLB一般。

更适合这类人
最适合追求技术成长和创新研究的求职者,看重前沿技术和学术机会。
表现最好
成长发展
相对薄弱
薪资福利
薪资福利50
成长发展92
工作生活60
使命价值70

薪资福利

50较低

实习薪资具有竞争力但整体有限,福利未明确提及,补偿性动机满足一般。

薪资信号未披露(AI估算:5K-10K/月)

成长发展

92较高

职位处于大模型前沿技术领域,团队学术氛围浓厚,有充足算力和研究资源,发展性动机满足度高。

技术前沿前沿/新兴技术
技术栈大模型、强化学习、RLHF、Post-training、自然语言处理
成长机会参与大语言模型核心技术研发、接触大规模RL、超长上下文、分布式训练和推理优化等前沿技术
业务类型ambiguous

工作生活

60中等

现场办公,位于北京市区核心地段,但未提及弹性工作或WLB政策,生活化动机满足中等。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值

70中等

大模型领域为高速增长赛道,技术应用前景广阔,但社会影响力中性,意义感满足良好。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

美团 的其他在招职位

  • WMS高级产品经理

    美团 · 北京市
    AI 估算 · 25k-40k
  • Keeta-代理商解决方案产品运营(Base巴西)

    美团 · 圣保罗
    AI 估算 · 20k-35k
  • 【医药健康】医美上游商业化产品运营

    美团 · 北京市
    AI 估算 · 25k-40k
  • 快乐猴供应链计划城市负责人

    美团 · 北京市
    AI 估算 · 35k-50k
  • B端产品经理

    美团 · 北京市
    AI 估算 · 25k-35k

相似职位推荐

  • 化學實驗室-前處理人員(台北日班)

    通标标准技术服务有限公司 · Xingzhen Village, New Taipei City, Taiwan
    AI 估算 · 6k-9k
  • AI Standards & Ecosystem | Sr. Staff Engineer

    高通 · 北京市
    AI 估算 · 60k-100k
  • 具身智能算法实习生

    网易 · 杭州市
    AI 估算 · 4k-8k
  • 游戏研发实习生(引擎方向)

    网易 · 上海市
    AI 估算 · 4k-6k
  • 图形学研究员实习生(动作生成方向)

    米哈游 · 上海市
    AI 估算 · 4k-8k

美团 的其他在招职位

  • WMS高级产品经理

    美团 · 北京市
    AI 估算 · 25k-40k
  • Keeta-代理商解决方案产品运营(Base巴西)

    美团 · 圣保罗
    AI 估算 · 20k-35k
  • 【医药健康】医美上游商业化产品运营

    美团 · 北京市
    AI 估算 · 25k-40k
  • 快乐猴供应链计划城市负责人

    美团 · 北京市
    AI 估算 · 35k-50k
  • B端产品经理

    美团 · 北京市
    AI 估算 · 25k-35k

相似职位推荐

  • 化學實驗室-前處理人員(台北日班)

    通标标准技术服务有限公司 · Xingzhen Village, New Taipei City, Taiwan
    AI 估算 · 6k-9k
  • AI Standards & Ecosystem | Sr. Staff Engineer

    高通 · 北京市
    AI 估算 · 60k-100k
  • 具身智能算法实习生

    网易 · 杭州市
    AI 估算 · 4k-8k
  • 游戏研发实习生(引擎方向)

    网易 · 上海市
    AI 估算 · 4k-6k
  • 图形学研究员实习生(动作生成方向)

    米哈游 · 上海市
    AI 估算 · 4k-8k