Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/美团/【基座大模型北斗实习】高性能计算与大模型系统优化
Meituan logo
M
美团 (Meituan)

职位信息

北京市
初级经验
实习生
仅现场办公
学历未注明
实习/见习

标签

高性能计算编译器优化CUDANCCL大模型TVMDeepSpeedMegatron系统顶会论文
💡

核心评价

技术前沿的大厂实习,成长空间巨大,是投身AI系统领域的黄金起点。

【基座大模型北斗实习】高性能计算与大模型系统优化

🤖 AI 估测:¥8K-15K

发布时间:22 天前

立即应聘

ℹ️关于这个职位

这是一个专注于大模型训练与推理系统底层性能优化的实习岗位
你将参与GPU/NPU等硬件平台的算子开发、编译优化或系统级调优,致力于提升大模型的计算效率
岗位要求具备扎实的GPU编程和深度学习框架经验,是深入高性能计算和AI系统领域的绝佳机会

✓工作职责

岗位职责 简介:参与面向大模型训练/推理的高性能计算与系统优化工作,可根据个人背景和研究兴趣选择以下方向之一深入推进:
面向GPU/NPU 等多硬件平台的算子开发与极致性能优化(CUDA/Cutlass/TileLang)
跟踪前沿模型算法并完成高性能工程落地,深入框架层开展算子融合、内存/通信优化、流水编排等系统级性能调优
探索基于大模型的高性能 Kernel 自动合成技术,参考 LLM-driven Kernel Generation 范式,研究高效 GPU/NPU Kernel 的端到端自动生成与迭代优化方法
基于DSL(如 Triton、TVM TIR、Halide 等)的编译优化与自动调优技术研究
多硬件后端(NVIDIA/国产芯片)的统一算子库建设与迁移适配

⭐最低要求

GPU编程:写过CUDA kernel,理解warp/SM/显存层次结构
训练框架:用过或改过Megatron/DeepSpeed/FSDP,不只是跑过demo
通信系统:了解NCCL原理,或有网络协议栈/RDMA相关经验
编译优化:接触过 XLA/TorchInductor/TVM 等编译器,或做过IR优化
顶会论文:MLSys/OSDI/SOSP/ATC/ISCA 等系统顶会在手
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

美团 的其他在招职位

  • 招聘负责人

    美团

    上海市 · 仅现场办公

  • Operations Data Analyst Intern

    美团

    北京市 · 仅现场办公

  • 广州经营主管

    美团

    佛山市 · 仅现场办公

  • 核心本地商业招聘经理-上海

    美团

    上海市 · 仅现场办公

  • 生产主管

    美团

    广州市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公