Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Meituan logo
美团
【北斗】CodeAgent后训练方向研究员(数据分析与ToSQL方向)
立即应聘

【北斗】CodeAgent后训练方向研究员(数据分析与ToSQL方向)

发布于 大约 3 小时前

普通员工/个人贡献者

北京市
高级经验
全职员工
仅现场办公
硕士
研究与开发 (研发)
强化学习
NeurIPS
GitHub
PRM
大模型
代码推理
ACL
MCTS
Agentic Rl

AI 估算 · 35k–60k

该岗位为高门槛研究岗,需要顶会论文和深度学习背景,美团薪资具有竞争力,参考AI研究员市场水平。

职位详情

关于这个职位

该岗位专注于大模型在复杂数据理解和数值推理方向的前沿研究,包括异构数据理解、Agentic强化学习、过程奖励模型等

你将利用美团海量真实业务数据,从场景构建到线上部署全链路参与,推动AI技术在生活服务领域的落地
适合在Agentic RL、代码推理等方向有深入研究的博士或硕士

最低要求

在Agentic RL、PRM或复杂代码推理等方向有深入研究

顶会论文发表(ACL/EMNLP/NeurIPS/ICLR/KDD等)者优先
GitHub高Star AI原生项目或向OpenClaw/OpenCode提交过核心PR者优先

工作职责

异构数据理解与数值推理:突破大模型在Table+文本混合形态下的信息丢失与幻觉瓶颈

Agentic RL与数据环境交互:构建基于代码执行沙盒与真实数据计算结果反馈的强化学习闭环
复杂推理与过程奖励(PRM):构建细粒度过程奖励模型,研究Test-Time Compute策略与MCTS搜索

AI 洞察

优缺点分析

优点

  • 拥有美团海量真实业务数据,研究贴近实际应用,成果可直接落地
  • 团队AI-Native文化,用AI研究AI,资源充足(GPU集群、Token)
  • 研究链路完整,从场景构建到部署全栈参与,成长空间大
  • 研究难度高,需要同时掌握强化学习、代码推理和自然语言处理等多领域知识
  • 工作强度可能较大,需要持续跟进前沿论文并快速实验迭代
  • 适合有顶会论文背景、热爱前沿研究、希望将学术成果应用于真实场景的AI研究员

缺点 / 挑战

暂无明显挑战项

角色解读

  • 在美团海量真实业务数据上验证研究成果,积累行业稀缺经验
  • 从研究员逐步成为技术Leader,带领团队攻克前沿技术难题
  • 可向AI科学家或技术专家方向发展,参与公司级技术战略制定
  • 研究大模型在表格和文本混合数据上的理解与推理,解决信息丢失和幻觉问题
  • 构建基于代码执行沙盒的强化学习闭环,利用真实数据反馈训练Agent
  • 开发细粒度过程奖励模型,结合Test-Time Compute策略和MCTS搜索提升推理能力
  • 扎实的机器学习/深度学习基础,熟悉强化学习算法(PPO、RLHF等)
  • 精通Python,有大型项目代码能力,熟悉GitHub协作
  • 有顶会论文(ACL/EMNLP/NeurIPS等)发表经验,具备独立科研能力

申请策略

  • 深入了解美团当前AI战略和基础研发平台的技术方向,在面试中展现对业务场景的理解
  • 准备好一个关于你过往研究如何应用于Agentic RL或数值推理的故事
  • 突出在Agentic RL、PRM或代码推理方向的具体研究成果,比如论文创新点、实验效果
  • 列出GitHub上高Star的AI项目或向开源社区提交的PR,证明工程能力
  • 如果有在美团或类似业务场景的实习/项目经验,重点描述数据理解与强化学习的结合
  • 补充Test-Time Compute和MCTS搜索的相关知识,阅读最新论文
  • 熟悉RLHF训练框架(如DeepSpeed、TRL),动手实践代码执行沙盒(如CodeSandbox)

面试指南

  • 对于RL算法问题,先讲直觉理解,再推导关键公式,最后举例应用场景
  • 对于研究问题,按「问题背景-现有方法局限-你的创新-实验验证」结构回答
  • 对于工程问题,描述具体实现细节,强调鲁棒性和效率
  • 请解释PPO算法的原理及其在Agentic RL中的应用
  • 如何设计一个过程奖励模型(PRM)来指导MCTS搜索?
  • 你在顶会论文中解决了什么关键问题?请详细描述方法
  • 对于Table+文本混合数据,目前大模型的瓶颈在哪里?你有什么改进思路?
  • 你熟悉哪些代码执行沙盒?如何构建强化学习的数据反馈闭环?

匹配度报告

75
综合匹配度

前沿AI研究岗,技术深度高,成长空间大,但工作强度未知,适合技术导向型人才。

适合人群
适合追求技术前沿、渴望在真实场景中快速成长的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利70
成长发展95
工作生活50
使命价值85

薪资福利匹配

70中等

美团上市公司,薪资待遇处于行业较高水平,但岗位未明确具体薪资和福利,推测有竞争力。

薪资信号未披露(AI估算:35K-60K/月)

成长发展匹配

95较高

岗位聚焦前沿技术(Agentic RL、PRM、MCTS),有充足GPU资源,能接触海量真实数据,成长空间极大。

技术前沿前沿/新兴技术
技术栈Agentic RL、PRM、MCTS、强化学习、大模型、代码推理
成长机会充足的资源、AI-Native研发文化
业务类型profit_center

工作生活匹配

50较低

未提及远程或弹性工作,北京办公,通常互联网大厂有一定工作压力。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

85较高

岗位致力于用AI改善生活服务体验,具有较高的社会价值,且属于前沿技术探索。

行业发展高速增长赛道
社会影响正向社会影响力较高
使命信号用科技创新为用户和生态伙伴创造超预期的交互体验和效率提升
创新程度开拓性创新(行业首创)
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

美团 的其他在招职位

  • 设备主管

    美团 · 成都市
    AI 估算 · 12k-20k
  • 生产主管-广州番禺RDC

    美团 · 广州市
    AI 估算 · 10k-18k
  • 门店经营分析师

    美团 · 北京市
    AI 估算 · 18k-28k
  • 【LongCat大模型人才校招】多模态交互算法研究员

    美团 · 北京市
    AI 估算 · 25k-40k
  • 物流规划工程实施

    美团 · 北京市
    AI 估算 · 15k-25k

相似职位推荐

  • 全域安全集成工程师-汽车专项-实习

    小米 · 南京市
    AI 估算 · 3k-5k
  • 仿真虚拟标定工程师-汽车专项-实习

    小米 · 南京市
    AI 估算 · 4k-6k
  • 产品安全风险管理工程师-汽车专项-实习

    小米 · 南京市
    AI 估算 · 4k-6k
  • 整车功能开发工程师-汽车专项-实习

    小米 · 南京市
    AI 估算 · 3k-5k
  • 整车架构与集成工程师-汽车专项-实习

    小米 · 南京市
    AI 估算 · 4k-6k

美团 的其他在招职位

  • 设备主管

    美团 · 成都市
    AI 估算 · 12k-20k
  • 生产主管-广州番禺RDC

    美团 · 广州市
    AI 估算 · 10k-18k
  • 门店经营分析师

    美团 · 北京市
    AI 估算 · 18k-28k
  • 【LongCat大模型人才校招】多模态交互算法研究员

    美团 · 北京市
    AI 估算 · 25k-40k
  • 物流规划工程实施

    美团 · 北京市
    AI 估算 · 15k-25k

相似职位推荐

  • 全域安全集成工程师-汽车专项-实习

    小米 · 南京市
    AI 估算 · 3k-5k
  • 仿真虚拟标定工程师-汽车专项-实习

    小米 · 南京市
    AI 估算 · 4k-6k
  • 产品安全风险管理工程师-汽车专项-实习

    小米 · 南京市
    AI 估算 · 4k-6k
  • 整车功能开发工程师-汽车专项-实习

    小米 · 南京市
    AI 估算 · 3k-5k
  • 整车架构与集成工程师-汽车专项-实习

    小米 · 南京市
    AI 估算 · 4k-6k