Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/美团/【大模型北斗实习】大模型推理系统前沿研究
Meituan logo
M
美团 (Meituan)

职位信息

北京市
无经验要求
实习生
仅现场办公
学历未注明
实习/见习

标签

分布式系统PyTorchCUDA模型压缩大模型推理算子优化
💡

核心评价

顶尖大厂AI推理系统前沿技术实习,成长性极佳,薪资符合实习标准,需现场办公。

【大模型北斗实习】大模型推理系统前沿研究

🤖 AI 估测:¥8K-15K

发布时间:26 天前

立即应聘

ℹ️关于这个职位

这是一个专注于大模型推理系统前沿研究的实习岗位
你将参与大模型推理加速与分布式系统优化的技术探索,通过软硬件协同设计和算法工程联合优化,致力于降低大模型推理的应用成本并提升其性能
工作内容涉及投机推理、分布式系统优化、稀疏Transformer优化与模型压缩等前沿方向

✓工作职责

岗位职责 大模型推理是大模型应用的核心能力,是影响大模型应用成本和效率的关键因素
本课题专注于大模型推理加速与分布式系统优化的前沿技术探索,通过软硬件协同设计和算法工程联合优化,降低大模型推理的应用成本,提高推理性能
研究内容包括但不限于:
1)投机推理(Speculative Decoding),研究基于预测性执行的动态推理优化方法,参与设计低延迟推理框架,通过概率模型预生成候选序列以降低解码计算开销
2)分布式系统优化,探索多节点协同推理中的通信-计算负载均衡策略,提出基于异构硬件的混合并行调度方案,实现吞吐量提升
3)稀疏Transformer优化与模型压缩,通过稀疏Transformer优化以及模型压缩技术提升模型的计算效率
4)算子优化,熟悉最新硬件架构的算子优化方法,通过更高效的算子优化模型的吞吐和延时

⭐最低要求

岗位要求:
1)熟悉TensorFlow、PyTorch等深度学习框架
2)熟悉Python、C++等至少一门编程语言,熟悉LINUX环境

👍优先资格

加分项:
1)有影响力的开源项目中做出过核心贡献
2)发表过高水平论文优先(如NeurIPS,ICLR,ICML,ACL,EMNLP等)
3)有CUDA/Triton编程经验
4)熟悉vllm/sglang/trt-llm/lmdeploy等开源推理框架
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

美团 的其他在招职位

  • 招聘负责人

    美团

    上海市 · 仅现场办公

  • Operations Data Analyst Intern

    美团

    北京市 · 仅现场办公

  • 广州经营主管

    美团

    佛山市 · 仅现场办公

  • 核心本地商业招聘经理-上海

    美团

    上海市 · 仅现场办公

  • 生产主管

    美团

    广州市 · 仅现场办公

相似职位推荐

  • 多模态实习生

    叠纸游戏

    上海市 · 仅现场办公

  • 大模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 图形图像算法实习生

    叠纸游戏

    图形图像算法实习生 · 仅现场办公

  • 算法工程师(武汉)

    多点数智

    武汉市 · 仅现场办公

  • 算法工程师(北京)

    多点数智

    北京市 · 仅现场办公