Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Meituan logo
美团
LongCat - 大模型推理 AI 工程师(多方向)
立即应聘

LongCat - 大模型推理 AI 工程师(多方向)

发布于 1 天前

普通员工/个人贡献者

北京市
中级经验
全职员工
仅现场办公
本科
深度学习
PyTorch
TensorFlow
CUDA
模型量化
vLLM
大模型推理
TensorRT-LLM

AI 估算 · 30k–60k

大模型推理是热门方向,美团大厂背景,北京地区3年以上经验,薪资有竞争力,中位数45k/月。

职位详情

关于这个职位

该职位负责大模型推理引擎的研发与优化,包括推理系统、模型量化压缩和部署

你将参与解决引擎中的技术难题,提升推理性能,并探索前沿技术
适合有C++/CUDA经验且对深度学习推理感兴趣的工程师

最低要求

大学本科及以上学历,计算机相关专业优先

至少3年以上软件开发经验,有推理引擎开发经验者优先考虑
熟练掌握C++、CUDA编程,熟悉常见的数据结构和算法
熟悉机器学习和深度学习理论,具备扎实的编程能力,熟悉Transformer结构优化者优先
熟悉常用的深度学习框架,如TensorFlow、PyTorch等,熟悉以下推理框架者优先sglang/vllm、FasterTransformer、DeepSpeed FastGen、TensorRT-LLM等
具备良好的团队合作精神和沟通能力,能够承担一定的工程管理职责

工作职责

负责大模型推理引擎的研发和优化,包括推理系统优化、模型量化压缩和模型部署

负责开发和维护基于大规模数据的推理引擎
参与解决推理过程中的技术难题,提升推理算法的性能和效果
开展相关领域的技术研究,提出创新性的解决方案

AI 洞察

优缺点分析

优点

  • 参与大模型推理前沿技术,技术成长快,行业需求旺盛
  • 美团大平台,资源丰富,可接触超大规模集群和海量数据
  • 薪资福利优厚,提供培训和晋升机制,职业发展路径清晰
  • 技术难度高,需要深入理解系统底层和深度学习原理
  • 大模型推理领域迭代快,需要持续学习新框架和优化方法

缺点 / 挑战

  • 工程管理职责可能带来一定压力,需平衡研发与管理
  • 适合有C++/CUDA经验、对深度学习推理有浓厚兴趣、愿意挑战高难度技术问题的工程师

角色解读

  • 技术深耕:从推理引擎开发走向系统架构师,主导大规模分布式推理系统设计
  • 跨领域拓展:结合业务需求,向AI平台、算法优化等方向延伸
  • 管理路径:积累工程经验后,可担任技术负责人或团队Leader
  • 负责大模型推理引擎的研发和优化,包括系统优化、模型量化压缩和部署
  • 开发和维护基于大规模数据的推理引擎,解决推理过程中的性能瓶颈
  • 参与前沿技术研究,提出创新解决方案,推动推理技术演进
  • 精通C++和CUDA编程,熟悉常见数据结构和算法
  • 扎实的深度学习和机器学习理论,熟悉Transformer架构
  • 熟悉主流深度学习框架(如PyTorch、TensorFlow)和推理框架(如vLLM、TensorRT-LLM)

申请策略

  • 关注美团技术博客和开源项目,了解其推理引擎技术栈,面试中可展示匹配度
  • 准备一个完整的推理优化案例,从问题到解决方案,体现技术深度
  • 突出C++和CUDA项目经验,尤其是高性能计算或推理优化相关
  • 强调深度学习框架使用经验,如PyTorch模型部署或量化
  • 如有推理框架(vLLM、TensorRT-LLM)使用或开发经历,重点展示
  • 深入学习CUDA编程和GPU架构,掌握模型量化、剪枝等技术
  • 熟悉主流推理框架的源码和优化技巧,如vLLM的调度机制
  • 补充分布式系统知识,了解大规模推理服务的部署与调优

面试指南

  • 对于优化类问题,从算法、系统、硬件三个层面分层回答,先理论后实践
  • 比较类问题,从性能、易用性、生态等维度展开,结合具体场景
  • 经验类问题,使用STAR法则:情境、任务、行动、结果
  • 如何优化Transformer模型的推理速度?请具体说明
  • 解释CUDA编程中shared memory和global memory的区别及优化策略
  • 比较vLLM和TensorRT-LLM的优缺点,你更倾向哪个?
  • 描述一次你解决推理系统瓶颈的经历
  • 大模型量化有哪些常见方法?如何选择量化精度?

匹配度报告

70
综合匹配度

美团大厂、前沿大模型推理方向、薪资优厚、技术成长快,但办公模式传统、WLB一般。

适合人群
最适合追求技术成长和职业发展的求职者,尤其是对前沿AI技术有热情的工程师。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利80
成长发展90
工作生活40
使命价值70

薪资福利匹配

80较高

薪资福利优厚,美团大厂提供五险一金、年终奖等,但JD未明确具体数字,整体补偿性较高。

薪资信号未披露(AI估算:30K-60K/月)
福利待遇薪资福利优厚、培训、晋升机制

成长发展匹配

90较高

职位涉及大模型推理前沿技术,且有培训晋升机制,发展性极强。

技术前沿前沿/新兴技术
技术栈大模型推理、CUDA、Transformer、vLLM、TensorRT-LLM
成长机会培训、晋升机制、技术前沿
业务类型ambiguous

工作生活匹配

40较低

仅现场办公,未提及弹性工作或WLB,北京通勤可能较长,加班情况不明。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

70中等

美团本地生活业务有社会价值,但职位偏向技术研发,直接社会影响力有限。

行业发展稳定成熟行业
社会影响中性/一般
使命信号驱动技术发展、创造行业价值
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

美团 的其他在招职位

  • 泰州苏中批市仓——晚班调度主管

    美团 · 泰州市
    AI 估算 · 7k-11k
  • 闪购-歪马-前置仓区域主管(哈尔滨/长春)

    美团 · 长春市
    AI 估算 · 10k-18k
  • 酒店业务-民宿方向-BD

    美团 · 广州市
    AI 估算 · 8k-15k
  • Keeta Drone-Business Development Manager(方案销售)

    美团 · 迪拜
    AI 估算 · 25k-45k
  • 政策合规实习生

    美团 · 深圳市
    AI 估算 · 4k-6k

相似职位推荐

  • 医疗行业解决方案架构师-火山引擎

    字节跳动 · 北京市
    AI 估算 · 35k-65k
  • 3D视觉仿真工程师/专家-PICO

    字节跳动 · 北京市
    AI 估算 · 35k-65k
  • 多媒体算法工程师(AI Infra)-视频与边缘

    字节跳动 · 上海市
    AI 估算 · 35k-65k
  • 开发工程师

    中国移动 · 贵阳市
    AI 估算 · 12k-20k
  • Dots-【Ace顶尖实习生】Long Horizon Agentic Task 能力提升研究

    小红书 · 北京市
    AI 估算 · 4k-8k

美团 的其他在招职位

  • 泰州苏中批市仓——晚班调度主管

    美团 · 泰州市
    AI 估算 · 7k-11k
  • 闪购-歪马-前置仓区域主管(哈尔滨/长春)

    美团 · 长春市
    AI 估算 · 10k-18k
  • 酒店业务-民宿方向-BD

    美团 · 广州市
    AI 估算 · 8k-15k
  • Keeta Drone-Business Development Manager(方案销售)

    美团 · 迪拜
    AI 估算 · 25k-45k
  • 政策合规实习生

    美团 · 深圳市
    AI 估算 · 4k-6k

相似职位推荐

  • 医疗行业解决方案架构师-火山引擎

    字节跳动 · 北京市
    AI 估算 · 35k-65k
  • 3D视觉仿真工程师/专家-PICO

    字节跳动 · 北京市
    AI 估算 · 35k-65k
  • 多媒体算法工程师(AI Infra)-视频与边缘

    字节跳动 · 上海市
    AI 估算 · 35k-65k
  • 开发工程师

    中国移动 · 贵阳市
    AI 估算 · 12k-20k
  • Dots-【Ace顶尖实习生】Long Horizon Agentic Task 能力提升研究

    小红书 · 北京市
    AI 估算 · 4k-8k