Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/小红书/深度学习推理优化-AI编译器方向
Xiaohongshu logo
X
小红书 (Xiaohongshu)

职位信息

北京市 / 上海市
中级经验
全职员工
仅现场办公
本科
普通员工/个人贡献者

标签

LLVM/MLIR性能调优深度学习推理TensorRTAI编译器TVMONNX RuntimeGpu/Npu优化计算图优化
💡

核心评价

技术前沿、发展空间大的AI编译器核心岗,薪资竞争力强,但需面对高难度挑战与可能的工作强度。

深度学习推理优化-AI编译器方向

🤖 AI 估测:¥35K-65K

发布时间:30 天前

立即应聘

ℹ️关于这个职位

这是一个专注于AI编译器与深度学习推理优化的核心研发岗位
你将加入小红书引擎架构部,负责设计和开发AI编译器前后端,优化深度学习模型在GPU/NPU等异构硬件上的推理性能
工作内容涉及编译器底层优化、性能瓶颈分析以及前沿编译技术的探索,旨在支撑公司搜广推、CV、NLP等核心业务的高效运行

✓工作职责

参与推理引擎的架构设计与核心模块的开发,参与AI编译器前后端的设计与实现,优化IR Compile模式下DSL特征处理引擎和AI推理引擎的性能
分析I/O性能瓶颈、优化编译耗时和codegen性能,改进编译优化算法,不断优化编译器,解决编译部署问题
优化IR Compile模式下搜广推、长序列、多模态、MoE等深度学习模型的推理效率
针对GPU/NPU等异构计算芯片,探索基于IR编译优化的片内多部件并行流水线等前沿技术,构建业界影响力

⭐最低要求

计算机及相关专业本科以上学历,3年以上AI编译器研发经验
精通C/C++,具备扎实的系统底层能力(内存、并发、网络)
熟悉XLA/LLVM/MLIR/TVM/IREE/Triton/Torch Inductor/TileLang等AI编译基础设施和相关工具链
熟悉TensorFlow Serving、TensorRT、OpenXLA、ONNX Runtime等推理后端
熟悉深度学习模型结构和计算图优化方法
有GPU/NPU集群建设与性能调优经验,能够定位并解决推理性能瓶颈

👍优先资格

有GPU/NPU异构计算芯片的优化经验
在TensorFlow、PyTorch、TVM、LLVM等社区有持续代码贡献
或有高质量技术博客、GitHub Repo、顶会论文(OSDI、SOSP、MLSys、KDD、RecSys 等)
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

小红书 的其他在招职位

  • AI产品运营实习生

    小红书

    上海市 · 仅现场办公

  • 点点AI运营实习生 · AI图像创作

    小红书

    上海市 · 仅现场办公

  • AI Agent算法工程师

    小红书

    北京市 · 仅现场办公

  • 【27届实习】OLAP研发工程师

    小红书

    北京市 · 仅现场办公

  • 【27届实习】Ray研发工程师

    小红书

    北京市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公