Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/小红书/大模型推理引擎研发工程师(练习生)
Xiaohongshu logo
X
小红书 (Xiaohongshu)

职位信息

北京市
中级经验
全职员工
仅现场办公
学历未注明
普通员工/个人贡献者

标签

分布式系统PyTorch高性能计算LLMCUDATensorRT推理引擎vLLM
💡

核心评价

技术前沿、成长空间大、薪资竞争力强的大厂核心研发岗,工作地点固定。

大模型推理引擎研发工程师(练习生)

🤖 AI 估测:¥35K-60K

发布时间:4 天前

立即应聘

ℹ️关于这个职位

这是一个专注于大模型推理引擎研发的工程师岗位
你将负责设计和优化面向大语言模型和多模态大模型的推理服务框架,通过并行计算、分布式架构和异构调度等技术,打造高效、易用的AI推理平台
同时,你需要与公司内各业务算法团队深度合作,进行算法与系统的联合优化,以支撑核心业务目标的达成

✓工作职责

参与/负责研发面向大语言模型(LLM)/多模态大模型(MLLM)等类型模型的推理服务框架
通过并行计算优化、分布式架构优化、异构调度等多种框架技术,打造高效、易用、领先的AI推理框架
深度参与周边深度学习系统多个子方向的工作,包括但不限于模型管理、推理部署、日志/监控、工作流编排等
与全公司各业务算法部门深度合作,为重点项目进行算法与系统的联合优化,支撑业务目标达成

⭐最低要求

优秀的代码能力、数据结构和基础算法功底,熟悉C++/Python开发,熟悉 Linux/Git 开发环境
熟悉至少一种主流基础深度学习训练或推理框架(TensorFlow/PyTorch/PaddlePaddle/TensorRT等)的使用和实现
熟悉主流LLM模型结构,熟悉至少一种主流LLM推理框架(vLLM/SGLang/TensorRT-LLM等)的使用和实现
熟悉GPU硬件架构,了解GPU 软件栈(CUDA,cuDNN),具备 GPU 性能分析的能力
有强烈的工作责任心,较好的学习能力、沟通协作能力和自驱力,能和团队一起探索新技术,推进技术进步

👍优先资格

熟悉CUDA编程,有TensorRT或其它AI加速库、高性能算子开发经验者优先
熟悉至少一种AI编译加速组件者优先,包含但不限与TorchInductor/TVM/Triton/XLA等
了解并行计算、网络通信、系统优化和集群硬件架构等相关知识者优先
熟悉NCCL/RDMA/IB/RoCE相关知识者优先
有优秀开源项目经历者优先
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

小红书 的其他在招职位

  • AI产品运营实习生

    小红书

    上海市 · 仅现场办公

  • 点点AI运营实习生 · AI图像创作

    小红书

    上海市 · 仅现场办公

  • AI Agent算法工程师

    小红书

    北京市 · 仅现场办公

  • 【27届实习】OLAP研发工程师

    小红书

    北京市 · 仅现场办公

  • 【27届实习】Ray研发工程师

    小红书

    北京市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公