Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Meituan logo
美团
【北斗】大模型训推引擎工程师(后训练/推理方向)
立即应聘

【北斗】大模型训推引擎工程师(后训练/推理方向)

发布于 大约 16 小时前

普通员工/个人贡献者

北京市
无经验要求
全职员工
仅现场办公
本科
软件工程
LLM
CUDA
RDMA
模型压缩
分布式训练
SGLang
vLLM
Megatron
Kv Cache

AI 估算 · 25k–35k

美团校招AI Infra岗位,技术前沿且难度高,参考互联网大厂硕士应届生薪资水平,月薪约2.5-3.5万

职位详情

关于这个职位

该职位是美团北斗计划中的大模型训推引擎工程师,专注于后训练和推理方向

你将参与构建面向Agent强化学习的分布式训练系统,优化LLM推理加速技术,包括长上下文训练、模型压缩、投机采样等前沿方向
适合对AI Infra有极客精神的2027届应届生

最低要求

届本科及以上学历,计算机、人工智能等相关专业

具备良好的计算机基础素养和分析解决问题的能力,熟练掌握C/C++或Python编程语言
学习能力强,对AI Infra方向有技术热情,富有极客精神
具备扎实的机器学习和深度学习基础,熟悉GPU、NPU硬件架构,熟悉CUDA、CCL、RDMA或者任意机器学习DSL
具有良好的沟通协作能力,工作积极主动

工作职责

方向一:面向Agent RL的LLM分布式后训练系统

多模态与超长上下文训练优化:针对万级以上超长序列(Long Context)及多模态输入,研究高效的上下文并行(CP/SP)、序列并行策略及分布式通信拓扑,优化内存足迹,支撑长文本与复杂多模态后训练
计算资源弹性调度与容错容灾:研究超大规模集群下的弹性训练技术(Elastic Training),实现节点动态加入/退出、无感故障自动恢复(Fault Tolerance)与训练超参数自动寻优,提升集群算力有效利用率(MFU)
Agent RL算法基础设施:构建面向Agent强化学习的高效Rollout引擎、多模型(Policy/Value/Reward/Reference)多阶段流水线编排及动态负载均衡机制
设计并建设支持高并发、低延迟的工具调用(Tool-use)虚拟环境/沙箱模拟器交互系统
训推一致性协同设计(Co-design):打通训练与推理底层架构,研究在后训练阶段(如在线RL、Iterative DPO)如何实现训练框架与高性能推理引擎的深度融合,降低在线反馈延迟,实现训推一体化高效演进
方向二:大模型高效推理与加速技术
面向Agent场景的动态推理架构:针对Agent多轮对话、工具调用等复杂交互带来的极致动态性,研究智能KV Cache管理优化策略(如动态复用、分级存储、长短时记忆重组),解决长序列及高并发下的显存瓶颈
极致模型压缩:研究前沿的模型压缩技术,包括先进的高比例量化(INT4/FP4/低比特混合精度)、结构化/非结构化稀疏(Sparsity),并开发对应的硬件友好型Mega算子,压榨硬件极限性能
下一代投机采样技术:深入研究并落地最前沿的解码加速技术,包括Draft-Target分离部署架构、Structured Speculative Decoding等异构投机采样方案
探索多Token预测(MTP)在线联合验证、无轻量模型依赖的自投机(Self-Speculative)等免草稿模型加速路径
前沿推理系统深度开发:跟踪并引领AI Infra业界最新进展,深度参与并优化主流开源推理框架,进行架构级的核心代码重构、极致的通信优化与算子融合,推动最新infra成果在核心业务的高效落地

优先资格

具备有影响力的大规模分布式系统、高性能计算项目经验

在OSDI、SOSP、NSDI、MLSys、ICML、ICLR、NeurIPS等顶级会议上有论文发表
在高影响力开源项目(如vLLM/SGLang/Megatron/verl等)有核心代码贡献

AI 洞察

优缺点分析

优点

  • 顶级算力资源:美团拥有大规模GPU集群,为技术探索提供充分支持
  • 开放研究氛围:鼓励论文发表和开源贡献,支持参加顶会,与学术界保持紧密合作
  • 大厂平台优势:美团本地生活业务场景丰富,技术成果可直接落地,影响广泛
  • 工作强度大:AI Infra方向迭代快,可能需要高强度投入以保持技术领先
  • 适合对AI系统底层技术充满热情、具备强动手能力和极客精神、希望在AI Infra领域成为技术专家的优秀应届生

缺点 / 挑战

  • 前沿技术挑战:直面Agent RL、训推一体等AI Infra最前沿问题,技术含量高
  • 技术门槛高:需要扎实的系统与算法背景,对CUDA、分布式系统等要求较高,学习曲线陡峭
  • 竞争激烈:作为美团北斗计划,吸引顶尖人才,内部晋升和绩效压力较大

角色解读

  • 技术专家路线:在AI Infra领域深耕,成为分布式训练、推理优化或系统架构方面的核心技术专家
  • 开源贡献路线:通过参与顶级开源项目(如vLLM、Megatron)建立社区影响力,成为开源领袖
  • 管理路线:后期可转向技术团队管理,带领团队攻克更复杂的AI基础设施挑战
  • 负责大模型后训练(如RLHF、DPO)的分布式系统设计与优化,包括长上下文训练、弹性调度、训推一体化
  • 开发大模型推理加速技术,如KV Cache管理、模型压缩(量化、稀疏)、投机采样等,提升Agent场景下的推理效率
  • 参与开源推理框架(如vLLM、SGLang)的深度开发与优化,推动AI Infra技术落地
  • 扎实的编程能力,熟练使用C/C++或Python,熟悉CUDA编程和GPU/NPU硬件架构
  • 深入理解分布式系统原理和高性能计算,有大规模分布式训练或推理经验
  • 熟悉机器学习/深度学习基础,了解Transformer、RLHF等主流模型和算法
  • 熟悉至少一种分布式通信框架(如RDMA、NCCL)或ML DSL(如Triton、TensorRT)

申请策略

  • 在申请前,了解美团在本地生活AI方向的具体业务(如搜索、推荐、广告),思考技术如何与其结合,面试时可展示业务理解
  • 建议准备一个个人技术项目(如实现简单的分布式训练系统或推理加速插件),展示工程能力
  • 突出分布式系统或高性能计算相关项目经验,包括系统设计、优化方法和成果数据
  • 展示CUDA编程、GPU优化或分布式训练框架(如Megatron、DeepSpeed)的实际使用经历
  • 如果有开源贡献(尤其vLLM、SGLang等)或顶会论文,务必详细列出并说明个人贡献
  • 强调对AI Infra的热情,例如个人博客、技术分享或参与过的相关竞赛
  • 深入学习CUDA编程与GPU架构(如内存层次、warp调度),可通过NVIDIA官方课程或动手实现简单算子来提升
  • 熟悉至少一个主流分布式训练框架(如Megatron-LM、DeepSpeed)的源码,理解其并行策略(TP、PP、SP)

面试指南

  • 针对系统设计类问题(如分布式并行策略),可采用“需求-设计-权衡”框架:先明确目标和约束,再提出多种方案,最后比较性能、扩展性、易用性的权衡
  • 针对优化类问题(如显存优化),采用“瓶颈分析-方案提出-实验验证”思路:先定位瓶颈(如计算密集型 vs. 带宽密集型),再给出具体优化手段(如算子融合、量化),最后预估提升效果
  • 针对开放性问题(如如何设计Agent RL的训练系统),可从系统模块划分(训练、推理、环境交互)出发,逐步细化每个模块的关键技术和挑战
  • 请解释Transformer模型中自注意力机制的计算流程,并说明其显存占用瓶颈
  • CUDA中的shared memory和global memory有什么区别?如何优化矩阵乘法的带宽?
  • 谈谈你对Megatron-LM中张量并行(TP)和流水线并行(PP)的理解,以及它们各自的优缺点
  • 在训练大模型时,如何通过序列并行(SP)处理超长序列?请描述一种可能的实现
  • 你对vLLM的PagedAttention机制有何理解?它如何解决KV Cache碎片化问题?

匹配度报告

71
综合匹配度

美团北斗计划,前沿AI Infra技术,资源顶级,发展空间大,但工作强度高、WLB一般。

适合人群
最匹配追求技术成长和前沿创新的求职者,适合愿意投入高密度学习、不在意WLB的极客型人才。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利75
成长发展95
工作生活45
使命价值70

薪资福利匹配

75中等

美团作为上市大厂,提供有竞争力的薪酬和福利,但JD未明确具体薪资。校招薪资通常位于行业前列,但具体福利未提及,因此补偿性动机中等偏上。

薪资信号未披露(AI估算:25K-35K/月)

成长发展匹配

95较高

该岗位技术前沿,涉及Agent RL、训推一体等最新方向,拥有顶级算力资源,鼓励开源和发表论文,发展性动机极强。

技术前沿前沿/新兴技术
技术栈LLM、Agent RL、分布式训练、KV Cache、模型压缩、投机采样、CUDA、RDMA、Megatron、vLLM
成长机会强化开源影响、开放研究氛围、鼓励论文发表、支持参加顶会
业务类型profit_center

工作生活匹配

45较低

工作地点在北京(仅现场办公),JD未提及弹性工作或WLB,且AI Infra方向通常工作强度较大,生活化动机满足度较低。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

70中等

美团本地生活智能平台愿景具有社会价值,但JD未突出使命感。AI Infra方向属于高速增长赛道,技术创新性高,但直接社会影响力有限。

行业发展高速增长赛道
社会影响中性/一般
使命信号打造全球领先的本地生活智能平台、重新定义下一代生活服务入口
创新程度开拓性创新(行业首创)
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

美团 的其他在招职位

  • 【北斗】基于大模型的搜索算法工程师

    美团 · 北京市
    AI 估算 · 6k-10k
  • 【北斗】广告大模型应用算法工程师-【多国多语言LLM-based 推搜广告】

    美团 · 北京市
    AI 估算 · 25k-35k
  • 市场营销实习生

    美团 · 北京市
    AI 估算 · 4k-6k
  • 【LongCat大模型人才校招】基础模型通用 agent 算法研究员

    美团 · 北京市
    AI 估算 · 20k-30k
  • 【北斗】AI决策算法研究员(外卖/即时零售方向)

    美团 · 北京市
    AI 估算 · 25k-45k

相似职位推荐

  • Electron 技术专家-MiMo

    小米 · 北京市
    AI 估算 · 35k-55k
  • 高级后端开发工程师-MiMo

    小米 · 北京市
    AI 估算 · 30k-50k
  • 高级客户端研发工程师-MiMo

    小米 · 北京市
    AI 估算 · 25k-45k
  • 推荐算法工程师-海外电商(redshop)方向

    小红书 · 北京市
    AI 估算 · 30k-50k
  • AI Agent 开发工程师

    小红书 · 上海市
    AI 估算 · 30k-50k

美团 的其他在招职位

  • 【北斗】基于大模型的搜索算法工程师

    美团 · 北京市
    AI 估算 · 6k-10k
  • 【北斗】广告大模型应用算法工程师-【多国多语言LLM-based 推搜广告】

    美团 · 北京市
    AI 估算 · 25k-35k
  • 市场营销实习生

    美团 · 北京市
    AI 估算 · 4k-6k
  • 【LongCat大模型人才校招】基础模型通用 agent 算法研究员

    美团 · 北京市
    AI 估算 · 20k-30k
  • 【北斗】AI决策算法研究员(外卖/即时零售方向)

    美团 · 北京市
    AI 估算 · 25k-45k

相似职位推荐

  • Electron 技术专家-MiMo

    小米 · 北京市
    AI 估算 · 35k-55k
  • 高级后端开发工程师-MiMo

    小米 · 北京市
    AI 估算 · 30k-50k
  • 高级客户端研发工程师-MiMo

    小米 · 北京市
    AI 估算 · 25k-45k
  • 推荐算法工程师-海外电商(redshop)方向

    小红书 · 北京市
    AI 估算 · 30k-50k
  • AI Agent 开发工程师

    小红书 · 上海市
    AI 估算 · 30k-50k