美团的【北斗】大模型训推引擎工程师（后训练/推理方向）薪资是多少？

该职位薪资范围为 25k–35k（人民币/月）。

【北斗】大模型训推引擎工程师（后训练/推理方向）的工作地点在哪里？

该职位工作地点位于北京市。工作形式为仅现场办公。

美团的【北斗】大模型训推引擎工程师（后训练/推理方向）有什么任职要求？

该职位要求本科学历及无经验要求工作经验。

美团

【北斗】大模型训推引擎工程师（后训练/推理方向）

立即应聘

【北斗】大模型训推引擎工程师（后训练/推理方向）

发布于大约 2 个月前

普通员工/个人贡献者

北京市

无经验要求

全职员工

仅现场办公

本科

软件工程

Agent Rl

Kv Cache

Megatron

分布式训练

模型压缩

CUDA

LLM

RDMA

SGLang

AI 估算 · 25k–35k

美团校招AI Infra岗位，技术前沿且难度高，参考互联网大厂硕士应届生薪资水平，月薪约2.5-3.5万

职位详情

关于这个职位

该职位是美团北斗计划中的大模型训推引擎工程师，专注于后训练和推理方向

你将参与构建面向Agent强化学习的分布式训练系统，优化LLM推理加速技术，包括长上下文训练、模型压缩、投机采样等前沿方向

适合对AI Infra有极客精神的2027届应届生

最低要求

届本科及以上学历，计算机、人工智能等相关专业

具备良好的计算机基础素养和分析解决问题的能力，熟练掌握C/C++或Python编程语言

学习能力强，对AI Infra方向有技术热情，富有极客精神

具备扎实的机器学习和深度学习基础，熟悉GPU、NPU硬件架构，熟悉CUDA、CCL、RDMA或者任意机器学习DSL

具有良好的沟通协作能力，工作积极主动

工作职责

方向一：面向Agent RL的LLM分布式后训练系统

多模态与超长上下文训练优化：针对万级以上超长序列（Long Context）及多模态输入，研究高效的上下文并行（CP/SP）、序列并行策略及分布式通信拓扑，优化内存足迹，支撑长文本与复杂多模态后训练

计算资源弹性调度与容错容灾：研究超大规模集群下的弹性训练技术（Elastic Training），实现节点动态加入/退出、无感故障自动恢复（Fault Tolerance）与训练超参数自动寻优，提升集群算力有效利用率（MFU）

Agent RL算法基础设施：构建面向Agent强化学习的高效Rollout引擎、多模型（Policy/Value/Reward/Reference）多阶段流水线编排及动态负载均衡机制

设计并建设支持高并发、低延迟的工具调用（Tool-use）虚拟环境/沙箱模拟器交互系统

训推一致性协同设计（Co-design）：打通训练与推理底层架构，研究在后训练阶段（如在线RL、Iterative DPO）如何实现训练框架与高性能推理引擎的深度融合，降低在线反馈延迟，实现训推一体化高效演进

方向二：大模型高效推理与加速技术

面向Agent场景的动态推理架构：针对Agent多轮对话、工具调用等复杂交互带来的极致动态性，研究智能KV Cache管理优化策略（如动态复用、分级存储、长短时记忆重组），解决长序列及高并发下的显存瓶颈

极致模型压缩：研究前沿的模型压缩技术，包括先进的高比例量化（INT4/FP4/低比特混合精度）、结构化/非结构化稀疏（Sparsity），并开发对应的硬件友好型Mega算子，压榨硬件极限性能

下一代投机采样技术：深入研究并落地最前沿的解码加速技术，包括Draft-Target分离部署架构、Structured Speculative Decoding等异构投机采样方案

探索多Token预测（MTP）在线联合验证、无轻量模型依赖的自投机（Self-Speculative）等免草稿模型加速路径

前沿推理系统深度开发：跟踪并引领AI Infra业界最新进展，深度参与并优化主流开源推理框架，进行架构级的核心代码重构、极致的通信优化与算子融合，推动最新infra成果在核心业务的高效落地

优先资格

具备有影响力的大规模分布式系统、高性能计算项目经验

在OSDI、SOSP、NSDI、MLSys、ICML、ICLR、NeurIPS等顶级会议上有论文发表

在高影响力开源项目（如vLLM/SGLang/Megatron/verl等）有核心代码贡献

AI 洞察

优缺点分析

优点

顶级算力资源：美团拥有大规模GPU集群，为技术探索提供充分支持
开放研究氛围：鼓励论文发表和开源贡献，支持参加顶会，与学术界保持紧密合作
大厂平台优势：美团本地生活业务场景丰富，技术成果可直接落地，影响广泛
工作强度大：AI Infra方向迭代快，可能需要高强度投入以保持技术领先
适合对AI系统底层技术充满热情、具备强动手能力和极客精神、希望在AI Infra领域成为技术专家的优秀应届生

缺点 / 挑战

前沿技术挑战：直面Agent RL、训推一体等AI Infra最前沿问题，技术含量高
技术门槛高：需要扎实的系统与算法背景，对CUDA、分布式系统等要求较高，学习曲线陡峭
竞争激烈：作为美团北斗计划，吸引顶尖人才，内部晋升和绩效压力较大

角色解读

技术专家路线：在AI Infra领域深耕，成为分布式训练、推理优化或系统架构方面的核心技术专家
开源贡献路线：通过参与顶级开源项目（如vLLM、Megatron）建立社区影响力，成为开源领袖
管理路线：后期可转向技术团队管理，带领团队攻克更复杂的AI基础设施挑战
负责大模型后训练（如RLHF、DPO）的分布式系统设计与优化，包括长上下文训练、弹性调度、训推一体化
开发大模型推理加速技术，如KV Cache管理、模型压缩（量化、稀疏）、投机采样等，提升Agent场景下的推理效率
参与开源推理框架（如vLLM、SGLang）的深度开发与优化，推动AI Infra技术落地
扎实的编程能力，熟练使用C/C++或Python，熟悉CUDA编程和GPU/NPU硬件架构
深入理解分布式系统原理和高性能计算，有大规模分布式训练或推理经验
熟悉机器学习/深度学习基础，了解Transformer、RLHF等主流模型和算法
熟悉至少一种分布式通信框架（如RDMA、NCCL）或ML DSL（如Triton、TensorRT）

申请策略

在申请前，了解美团在本地生活AI方向的具体业务（如搜索、推荐、广告），思考技术如何与其结合，面试时可展示业务理解
建议准备一个个人技术项目（如实现简单的分布式训练系统或推理加速插件），展示工程能力
突出分布式系统或高性能计算相关项目经验，包括系统设计、优化方法和成果数据
展示CUDA编程、GPU优化或分布式训练框架（如Megatron、DeepSpeed）的实际使用经历
如果有开源贡献（尤其vLLM、SGLang等）或顶会论文，务必详细列出并说明个人贡献
强调对AI Infra的热情，例如个人博客、技术分享或参与过的相关竞赛
深入学习CUDA编程与GPU架构（如内存层次、warp调度），可通过NVIDIA官方课程或动手实现简单算子来提升
熟悉至少一个主流分布式训练框架（如Megatron-LM、DeepSpeed）的源码，理解其并行策略（TP、PP、SP）

面试指南

针对系统设计类问题（如分布式并行策略），可采用“需求-设计-权衡”框架：先明确目标和约束，再提出多种方案，最后比较性能、扩展性、易用性的权衡
针对优化类问题（如显存优化），采用“瓶颈分析-方案提出-实验验证”思路：先定位瓶颈（如计算密集型 vs. 带宽密集型），再给出具体优化手段（如算子融合、量化），最后预估提升效果
针对开放性问题（如如何设计Agent RL的训练系统），可从系统模块划分（训练、推理、环境交互）出发，逐步细化每个模块的关键技术和挑战
请解释Transformer模型中自注意力机制的计算流程，并说明其显存占用瓶颈
CUDA中的shared memory和global memory有什么区别？如何优化矩阵乘法的带宽？
谈谈你对Megatron-LM中张量并行（TP）和流水线并行（PP）的理解，以及它们各自的优缺点
在训练大模型时，如何通过序列并行（SP）处理超长序列？请描述一种可能的实现
你对vLLM的PagedAttention机制有何理解？它如何解决KV Cache碎片化问题？

职位点评

综合评分

美团北斗计划，前沿AI Infra技术，资源顶级，发展空间大，但工作强度高、WLB一般。

从起薪待遇、成长路径、工作节奏和岗位方向综合评估，方便比较职业起点。

更适合这类人

最匹配追求技术成长和前沿创新的求职者，适合愿意投入高密度学习、不在意WLB的极客型人才。

表现最好

成长发展

相对薄弱

工作生活

薪资福利75

成长发展95

工作生活45

使命价值70

薪资福利

75中等

美团作为上市大厂，提供有竞争力的薪酬和福利，但JD未明确具体薪资。校招薪资通常位于行业前列，但具体福利未提及，因此补偿性动机中等偏上。

薪资信号未披露（AI估算：25K-35K/月）

成长发展

95较高

该岗位技术前沿，涉及Agent RL、训推一体等最新方向，拥有顶级算力资源，鼓励开源和发表论文，发展性动机极强。

技术前沿前沿/新兴技术

技术栈LLM、Agent RL、分布式训练、KV Cache、模型压缩、投机采样、CUDA、RDMA、Megatron、vLLM

成长机会强化开源影响、开放研究氛围、鼓励论文发表、支持参加顶会

业务类型profit_center

工作生活

45较低

工作地点在北京（仅现场办公），JD未提及弹性工作或WLB，且AI Infra方向通常工作强度较大，生活化动机满足度较低。

工作模式仅现场办公

办公地点市区核心地段

加班情况未提及（无法判断）

使命价值

70中等

美团本地生活智能平台愿景具有社会价值，但JD未突出使命感。AI Infra方向属于高速增长赛道，技术创新性高，但直接社会影响力有限。

行业发展高速增长赛道

社会影响中性/一般

使命信号打造全球领先的本地生活智能平台、重新定义下一代生活服务入口

创新程度开拓性创新（行业首创）

美团的其他在招职位

相似职位推荐

Watch Jobs

【北斗】大模型训推引擎工程师（后训练/推理方向）

职位详情

关于这个职位

最低要求

工作职责

优先资格

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

Keeta-商业分析师（经营分析）-卡塔尔

服务治理高级产品经理

食杂零售综合分析

内容传播实习生（内容编辑与设计方向）

分析应用平台研发工程师

IT-算法工程师-杭州

大模型算法工程师

软件开发岗（AI应用方向）

海康汽车电子-IOS开发工程师-杭州

交通与停车-高级嵌入式软件开发工程师-杭州

美团的其他在招职位

Keeta-商业分析师（经营分析）-卡塔尔

服务治理高级产品经理

食杂零售综合分析

内容传播实习生（内容编辑与设计方向）

分析应用平台研发工程师

相似职位推荐

IT-算法工程师-杭州

大模型算法工程师

软件开发岗（AI应用方向）

海康汽车电子-IOS开发工程师-杭州

交通与停车-高级嵌入式软件开发工程师-杭州

【北斗】大模型训推引擎工程师（后训练/推理方向）

职位详情

关于这个职位

最低要求

工作职责

优先资格

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

美团 的其他在招职位

Keeta-商业分析师（经营分析）-卡塔尔

服务治理高级产品经理

食杂零售综合分析

内容传播实习生（内容编辑与设计方向）

分析应用平台研发工程师

相似职位推荐

IT-算法工程师-杭州

大模型算法工程师

软件开发岗（AI应用方向）

海康汽车电子-IOS开发工程师-杭州

交通与停车-高级嵌入式软件开发工程师-杭州

美团的其他在招职位