Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/美团/【基座大模型北斗实习】大模型训练研究
Meituan logo
M
美团 (Meituan)

职位信息

北京市
中级经验
实习生
仅现场办公
学历未注明
实习/见习

标签

高性能计算编译器优化CUDANCCL分布式训练大模型DeepSpeedMegatron
💡

核心评价

技术硬核、前沿顶尖的大模型训练系统实习,成长性极佳,是技术精英的练兵场。

【基座大模型北斗实习】大模型训练研究

🤖 AI 估测:¥8K-15K

发布时间:22 天前

立即应聘

ℹ️关于这个职位

这是一个专注于大模型分布式训练系统优化的实习岗位
你将深入美团的实际训练场景,负责优化千亿参数模型在万卡集群上的训练效率与稳定性
核心工作包括改造训练框架、设计并行策略、编写高性能算子,目标是榨干GPU算力,将训练崩溃损失降到最低,并大幅缩短工程师等待结果的时间

✓工作职责

分布式训练框架优化
①深入源码,针对美团训练场景做定制化改造
②设计和实现更高效的张量并行、流水线并行、数据并行混合策略
③探索 MoE(混合专家) 模型的并行训练方案,解决专家负载均衡、通信爆炸等硬问题
计算效率优化
①基于 CUDA / Triton 编写和优化高性能算子(FlashAttention、FusedMLP等)
②分析训练 profiling 数据,定位计算/通信/内存的瓶颈并针对性优化
③推进混合精度训练、梯度压缩等技术落地

⭐最低要求

GPU编程:写过CUDA kernel,理解warp/SM/显存层次结构
训练框架:用过或改过Megatron/DeepSpeed/FSDP,不只是跑过demo
通信系统:了解NCCL原理,或有网络协议栈/RDMA相关经验
编译优化:接触过 XLA/TorchInductor/TVM 等编译器,或做过IR优化
顶会论文:MLSys/OSDI/SOSP/ATC/ISCA 等系统顶会在手
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

美团 的其他在招职位

  • 招聘负责人

    美团

    上海市 · 仅现场办公

  • Operations Data Analyst Intern

    美团

    北京市 · 仅现场办公

  • 广州经营主管

    美团

    佛山市 · 仅现场办公

  • 核心本地商业招聘经理-上海

    美团

    上海市 · 仅现场办公

  • 生产主管

    美团

    广州市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公