Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业定价
我的收藏免费试用登录注册

Meituan logo
美团
【北斗】大模型推理系统工程师
立即应聘

【北斗】大模型推理系统工程师

发布于 大约 16 小时前

普通员工/个人贡献者

北京市
高级经验
全职员工
仅现场办公
学历未注明
软件工程
分布式系统
PyTorch
CUDA
模型压缩
SGLang
vLLM
推理加速
算子优化

AI 估算 · 25k–45k

大厂核心部门,大模型热门方向,技术难度高,薪资具有市场竞争力。

职位详情

关于这个职位

加入美团龙猫基座大模型团队,你将专注于大模型推理加速与分布式系统优化,通过软硬件协同设计和算法工程联合优化,降低推理成本、提升性能

研究涵盖投机推理、分布式系统优化、稀疏Transformer和算子优化,前沿技术落地真实业务场景,成长空间大

最低要求

熟悉PyTorch等深度学习框架

熟悉sglang、vLLM、trt-llm、FasterTransformer等开源框架
能够熟练掌握Python、C++、CUDA等开发语言中的一种
有比较强的数据结构、算法和统计分析、数学建模的能力

工作职责

投机推理(Speculative Decoding),研究基于预测性执行的动态推理优化方法,参与设计低延迟推理框架

分布式系统优化,探索多节点协同推理中的通信-计算负载均衡策略,提出基于异构硬件的混合并行调度方案
稀疏Transformer优化与模型压缩,提升模型计算效率
算子优化,熟悉最新硬件架构,通过高效算子优化吞吐和延时

AI 洞察

优缺点分析

优点

  • 丰富的业务场景:美团拥有海量真实订单场景,研究可直接落地,成果影响力大
  • 团队实力强:背靠公司核心研发平台,有优秀的技术导师和协作氛围,个人成长迅速
  • 软硬协同工作模式:算法与系统结合,全面锻炼工程与算法能力
  • 技术难度高:需要同时掌握算法(模型压缩、推理架构)和底层系统(CUDA、分布式通信)知识,学习曲线陡峭
  • 工作强度可能较大:作为核心基础平台,项目节奏快,需要应对高并发、低延迟的严苛要求
  • 适合具备扎实深度学习和系统编程背景、对性能优化有极致追求、渴望在AI Infra前沿领域深耕的工程师

缺点 / 挑战

  • 前沿技术方向:大模型推理是当前AI落地的核心瓶颈,技术价值高、行业需求旺盛
  • 持续学习压力:大模型技术迭代快速,需不断跟进最新论文与开源工具

角色解读

  • 技术纵深发展:成为大模型推理与系统优化专家,主导核心组件设计与性能突破
  • 算法工程复合型:从推理加速扩展到训练优化,成长为训推一体的AI Infra架构师
  • 团队管理:随着项目规模扩大,可晋升为技术Leader,带领团队攻克更复杂的系统级难题
  • 研究并实现大模型推理加速算法,如投机解码、稀疏Transformer优化等,降低延迟和计算成本
  • 优化分布式推理系统,设计多节点通信与计算负载均衡策略,提升推理吞吐量
  • 针对最新硬件架构(如GPU)进行算子级优化,编写高效CUDA/C++代码,压榨硬件性能
  • 基于PyTorch和sglang/vLLM等框架,集成和落地推理优化方案,支撑美团业务场景
  • 精通PyTorch等深度学习框架,熟悉主流大模型推理框架(vLLM、sglang、FasterTransformer等)
  • 扎实的编程能力,熟练掌握Python、C++、CUDA之一,能手写高性能算子
  • 深入理解Transformer架构,对模型压缩、稀疏化、量化等技术有实践经验
  • 具备分布式系统知识,熟悉通信优化(如NCCL)和异构并行调度

申请策略

  • 在面试中强调你对「将算法落地到实际系统」的理解,而不仅仅是理论
  • 关注美团的业务场景(外卖、到店等),思考大模型推理如何赋能本地生活服务,展现业务视野
  • 突出推理加速或分布式系统相关项目经历,具体描述优化效果(延迟降低、吞吐提升)
  • 强调对主流推理框架(vLLM、sglang等)的熟悉程度,附上GitHub开源贡献或相关博客
  • 展示C++/CUDA编程能力,如有高性能计算或算子优化经验(如Flash Attention)务必突出
  • 若参与过大模型训练或推理系统的架构设计,要详细说明你的角色和关键技术决策
  • 深入学习CUDA编程和GPU架构(如NVIDIA Ampere、Hopper)的优化技巧
  • 动手实践vLLM、TensorRT-LLM等框架的源码,理解其调度和内存管理机制

面试指南

  • 对于系统设计题:先明确目标(延迟/吞吐量/内存),然后分析瓶颈,提出多个候选方案(如量化、并行策略、算子融合),并对比优缺点
  • 对于算法题:先简述核心思想,然后讨论实现细节(如概率模型、候选策略),提及可能的优化(如树型探索)和trade-off
  • 对于编程/优化题:从内存布局、计算模式、并行度、硬件特性等角度分析,给出具体优化手段(如向量化、循环展开、共享内存分块)
  • 请解释vLLM中的PagedAttention原理及其对推理效率的提升
  • 如何设计一个分布式推理系统来支持多节点流水线并行?你会如何处理通信瓶颈?
  • 谈谈你对投机解码(Speculative Decoding)的理解,以及实现时需要注意的关键点
  • CUDA中shared memory和global memory的使用有何优化策略?请举例说明
  • 假设需要将一个大模型(如70B参数)部署在8张A100上并提供低延迟服务,你会采用哪些技术方案?

匹配度报告

66
综合匹配度

大厂核心AI Infra岗,前沿技术栈、成长空间巨大,但工作强度高、WLB有限。

适合人群
最适合追求技术深度和前沿成长、愿意投入高强度工作换取快速进步的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利68
成长发展92
工作生活35
使命价值70

薪资福利匹配

68中等

JD未明确薪资和福利,但大厂核心岗位通常薪资较高、福利完善;不过作为技术岗,薪资依赖面试定级,存在不确定性。

薪资信号未披露(AI估算:25K-45K/月)

成长发展匹配

92较高

JD强调前沿技术(投机推理、稀疏Transformer等)、软硬协同、大量内部落地场景和团队工程算法实力强,成长环境极佳。

技术前沿前沿/新兴技术
技术栈PyTorch、vLLM、sglang、CUDA、分布式系统、模型压缩、算子优化、Transformer
成长机会对个人的能力提升大、获得非常好的成长环境、研究和应用相辅相成
业务类型ambiguous

工作生活匹配

35较低

未说明远程或弹性办公,北京现场办公,大厂技术团队通常加班强度不低,WLB信号弱。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

70中等

大模型是高速增长赛道,但JD侧重于技术性能而非社会价值,使命导向不明显。

行业发展高速增长赛道
社会影响中性/一般
使命信号把智能带进真实物理世界、亲手打造下一代AGI
创新程度开拓性创新(行业首创)
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

美团 的其他在招职位

  • 内容营销实习生

    美团 · 北京市
    AI 估算 · 4k-6k
  • 餐饮SaaS高级测试开发工程师

    美团 · 北京市
    AI 估算 · 25k-45k
  • 鲜肉自营采购-鲜牛羊

    美团 · 北京市
    AI 估算 · 25k-40k
  • 美团酒店旅行-交通财务BP

    美团 · 北京市
    AI 估算 · 25k-45k
  • PC加工专家

    美团 · 北京市
    AI 估算 · 25k-40k

相似职位推荐

  • 辅助驾驶HMI后处理研发工程师-2027届

    小米 · 北京市
    AI 估算 · 4k-6k
  • 服务端高级研发工程师

    小米 · 武汉市
    AI 估算 · 25k-40k
  • 高级语音测试开发工程师

    小米 · 北京市
    AI 估算 · 30k-45k
  • 微信-基础功能后台开发

    腾讯 · 广州市
    AI 估算 · 20k-35k
  • 微信-AI应用开发工程师

    腾讯 · 广州市
    AI 估算 · 20k-40k

美团 的其他在招职位

  • 内容营销实习生

    美团 · 北京市
    AI 估算 · 4k-6k
  • 餐饮SaaS高级测试开发工程师

    美团 · 北京市
    AI 估算 · 25k-45k
  • 鲜肉自营采购-鲜牛羊

    美团 · 北京市
    AI 估算 · 25k-40k
  • 美团酒店旅行-交通财务BP

    美团 · 北京市
    AI 估算 · 25k-45k
  • PC加工专家

    美团 · 北京市
    AI 估算 · 25k-40k

相似职位推荐

  • 辅助驾驶HMI后处理研发工程师-2027届

    小米 · 北京市
    AI 估算 · 4k-6k
  • 服务端高级研发工程师

    小米 · 武汉市
    AI 估算 · 25k-40k
  • 高级语音测试开发工程师

    小米 · 北京市
    AI 估算 · 30k-45k
  • 微信-基础功能后台开发

    腾讯 · 广州市
    AI 估算 · 20k-35k
  • 微信-AI应用开发工程师

    腾讯 · 广州市
    AI 估算 · 20k-40k