Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/小红书/大模型推理框架研发工程师/专家
Xiaohongshu logo
X
小红书 (Xiaohongshu)

职位信息

北京市 / 上海市
高级经验
全职员工
仅现场办公
学历未注明
普通员工/个人贡献者

标签

分布式系统并行计算推理框架系统容错大语言模型 (Llm)Kvcache多模态大模型 (Mllm)
💡

核心评价

头部大厂AI核心岗,技术前沿成长快,薪资预期高,但需接受一线城市现场办公及可能的工作强度。

大模型推理框架研发工程师/专家

🤖 AI 估测:¥35K-70K

发布时间:28 天前

立即应聘

ℹ️关于这个职位

该职位是小红书大模型基础设施团队的核心研发岗位,专注于构建高效、易用的大模型推理服务框架
你将负责研发面向LLM/MLLM的推理框架,优化分布式推理能力(如KV Router、KVCache管理),并构建系统容错能力,以支撑公司各业务线的AI技术高效落地

✓工作职责

参与/负责研发面向大语言模型(LLM)/多模态大模型(MLLM)等类型模型的推理服务框架
参与/负责KV Router、PD分离/EPD分离、KVCache管理、动态PD调整等分布式推理能力建设
通过并行计算优化、分布式架构优化、异构调度等多种框架技术,打造高效、易用、领先的AI推理框架
参与/负责构建推理框架的系统容错能力,包括但不限于请求迁移、优雅退出、故障检测、自愈等能力建设
深度参与周边深度学习系统多个子方向的工作,包括但不限于模型管理、推理部署、日志/监控、工作流编排等
与全公司各业务算法部门深度合作,为重点项目进行算法与系统的联合优化,支撑业务目标达成

⭐最低要求

优秀的代码能力、数据结构和基础算法功底,熟悉Rust/C++/python开发
熟悉至少一种主流的推理框架(Nvidia dynamo、vLLM、SGLang、AIBrix等)的原理和实现
有强烈的工作责任心,较好的学习能力、沟通能力和自驱力
良好的沟通协作能力,能和团队一起探索新技术,推进技术进步
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

小红书 的其他在招职位

  • AI产品运营实习生

    小红书

    上海市 · 仅现场办公

  • 点点AI运营实习生 · AI图像创作

    小红书

    上海市 · 仅现场办公

  • AI Agent算法工程师

    小红书

    北京市 · 仅现场办公

  • 【27届实习】OLAP研发工程师

    小红书

    北京市 · 仅现场办公

  • 【27届实习】Ray研发工程师

    小红书

    北京市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公