Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/美团/AI高阶工程-大模型推理
Meituan logo
M
美团 (Meituan)

职位信息

北京市
高级经验
全职员工
仅现场办公
硕士
普通员工/个人贡献者

标签

分布式系统PyTorch性能分析模型优化TensorRT异构计算大模型推理ONNX Runtime
💡

核心评价

一线大厂高阶技术岗,聚焦前沿大模型推理,技能成长空间巨大,薪资竞争力强,但需考虑工作强度。

AI高阶工程-大模型推理

🤖 AI 估测:¥45K-80K

发布时间:27 天前

立即应聘

ℹ️关于这个职位

该职位是美团基础研发平台的大模型推理工程师,主要负责大规模预训练模型(如GPT、LLM)的推理系统设计、优化与落地
你将深入应用模型量化、剪枝等前沿加速技术,并参与构建高性能、多硬件的统一推理框架,以支撑公司内大模型应用的低成本探索和高并发需求

✓工作职责

负责大规模预训练模型(如GPT、BERT、LLM等)的推理系统设计、优化与落地,实现模型在多平台(GPU、CPU、NPU等)上的高效推理
针对模型推理场景,深入分析性能瓶颈,主导模型量化、剪枝、蒸馏、结构重参数化等前沿推理加速技术的研究与应用
参与大模型推理框架(如TensorRT、ONNX Runtime、OpenVINO、MindSpore等)的开发与优化,提升推理效率与系统稳定性
跟踪业界和学术界大模型推理相关前沿技术,推动创新方案在业务中的应用落地
与算法、系统、硬件等团队紧密协作,制定端到端的推理优化方案,支撑业务高并发、低延迟的需求
负责推理平台的技术难点攻关,解决模型部署、兼容性、资源调度等实际问题

⭐最低要求

计算机、人工智能、电子工程等相关专业硕士及以上学历,5年以上AI推理/系统优化相关工作经验
深入理解主流大模型结构及推理原理,熟悉Transformer、LLM等模型的高效推理优化技术
精通至少一种主流深度学习框架(如PyTorch、TensorFlow、MindSpore等)及其推理引擎(如TensorRT、ONNX Runtime等)
熟悉模型压缩、量化、剪枝、蒸馏等加速技术,并有实际落地经验
扎实的编程能力,精通C++/Python,具备良好的系统调优与性能分析能力
具备良好的团队协作、沟通能力和创新精神,能承担复杂项目的技术攻关任务

👍优先资格

有大规模分布式推理、异构计算(GPU/CPU/NPU)或端侧推理部署经验者优先
有相关开源项目贡献、顶会论文发表或大模型推理产品化经验者优先
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

美团 的其他在招职位

  • 招聘负责人

    美团

    上海市 · 仅现场办公

  • Operations Data Analyst Intern

    美团

    北京市 · 仅现场办公

  • 广州经营主管

    美团

    佛山市 · 仅现场办公

  • 核心本地商业招聘经理-上海

    美团

    上海市 · 仅现场办公

  • 生产主管

    美团

    广州市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公