Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/小红书/大模型训练基础架构工程师
Xiaohongshu logo
X
小红书 (Xiaohongshu)

职位信息

北京市 / 上海市
高级经验
全职员工
仅现场办公
学历未注明
普通员工/个人贡献者

标签

CUDANCCLMLIR分布式训练大模型DeepSpeedAi InfraMegatron
💡

核心评价

顶尖互联网公司核心AI Infra岗,技术前沿且深度,薪资竞争力强,但需坐班且可能高强度。

大模型训练基础架构工程师

🤖 AI 估测:¥45K-80K

发布时间:29 天前

立即应聘

ℹ️关于这个职位

这是一个专注于AI基础设施研发的核心技术岗位
你将负责设计和开发支持超大规模多模态生成式模型的分布式训练框架,通过优化计算、通信和内存来提升训练效率,并利用CUDA、Triton等工具编写高性能算子,最终支撑前沿AI模型在小红书平台上的落地应用

✓工作职责

开发支持下一代多模态生成式搜广推超大规模(百亿-万亿级)模型的GPU千卡互联分布式训练框架
通过分布式并行/流水线/通信优化或ZeRO等,消除大规模分布式训练通讯/计算/内存瓶颈
通过Triton,TileLang计算图编译优化或者使用CUDA/cutlass编写高性能算子,将硬件性能压榨到极致,最大化发挥出CPU/GPU等异构硬件协同算力
支撑业界领先的多模态模型在国内最大的生活兴趣社区上落地

⭐最低要求

有扎实的工程算法基础,精通数据结构和常用算法,熟练掌握各种编译、调试、性能分析工具
精通C/C++/CUDA,具备扎实的系统底层能力(内存、并发、网络)
有大规模分布式系统开发和优化经验
有大模型分布式训练经验者优先
精通MLIR/TVM/Triton/Torch Inductor/TileLang/Verbs/NCCL/NVSHMEM等分布式异构计算框架和相关工具链
精通Megatron/DeepSpeed/veRL/OpenRLHF/LLaMA-Factory等业界开源训练框架
熟悉常见深度学习模型结构

👍优先资格

在Megatron、DeepSpeed、veRL、TVM、LLVM等社区有持续代码贡献
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

小红书 的其他在招职位

  • AI产品运营实习生

    小红书

    上海市 · 仅现场办公

  • 点点AI运营实习生 · AI图像创作

    小红书

    上海市 · 仅现场办公

  • AI Agent算法工程师

    小红书

    北京市 · 仅现场办公

  • 【27届实习】OLAP研发工程师

    小红书

    北京市 · 仅现场办公

  • 【27届实习】Ray研发工程师

    小红书

    北京市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公