Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/英伟达/Senior Solutions Architect - KV Cache and AI Storage
Nvidia logo
N
英伟达 (Nvidia)

职位信息

北京市
高级经验
全职员工
仅现场办公
本科
普通员工/个人贡献者

标签

性能优化NVIDIA GPUvLLMTensorRT-LLMKv CacheCephLlm InferenceAi Storage
💡

核心评价

顶尖AI公司前沿技术岗,薪资高成长快,使命感强,但WLB可能面临挑战。

Senior Solutions Architect - KV Cache and AI Storage

🤖 AI 估测:¥45K-80K

发布时间:19 天前

立即应聘

ℹ️关于这个职位

这是一个面向AI基础设施的高级解决方案架构师职位,专注于KV缓存与AI存储领域
你将与英伟达的大客户紧密合作,基于NVIDIA GPU、Dynamo/KVBM和CMX等技术,共同构建下一代大语言模型推理平台
核心工作包括设计端到端的KV缓存解决方案、进行性能分析与优化,并将客户需求转化为产品路线图输入

✓工作职责

与客户架构师进行技术探索,了解模型、框架、SLO和KV缓存使用模式
使用分层内存和NVIDIA现代网络技术构建端到端的KV缓存解决方案
分析性能概况,识别瓶颈,并推动概念验证和基准测试以验证改进
将客户遇到的困难转化为清晰的功能需求和NVIDIA产品的路线图输入
构建参考架构、最佳实践指南,并进行技术演讲,以支持我们的现场团队和客户

⭐最低要求

计算机科学或相关专业学士及以上学位,具备扎实的系统或存储背景
5年以上相关工作经验,其中至少2年专注于KV存储/缓存或存储后端
具备分布式存储、缓存或大规模后端系统的实践经验
深入理解Transformer/LLM推理和KV缓存概念,并有至少一种LLM服务栈(如vLLM、TensorRT-LLM或SGLang)的使用经验
熟悉NVMe SSD、KV SSD和现代存储服务器,包括控制器/固件行为和I/O特性
具备分层内存和KV缓存优化(如卸载、驱逐/选择策略、压缩/量化或注意力级别优化)的实践经验
熟悉至少一种大规模存储或缓存系统(如Ceph、Redis、Cassandra、基于RocksDB的KV、对象存储或分布式日志)

👍优先资格

在云或互联网公司(多租户、配额、成本控制)中构建或运行LLM推理平台或大规模在线服务的经验
在文件系统、用户空间存储引擎或内存/缓存管理器中开发KV缓存子系统,或为AI/LLM优化的自定义KV存储/缓存层的经验
接触过NVIDIA技术,如Triton Inference Server、TensorRT-LLM、NeMo、Dynamo/KVBM、BlueField / DOCA、GPUDirect Storage、Spectrum-X或CMX
在LLM推理、KV缓存或存储系统领域有公开演讲、论文、博客或开源项目贡献
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

英伟达 的其他在招职位

  • Machine Learning Engineer - Humanoid Robotics

    英伟达

    上海市 · 仅现场办公

  • System Software Engineer, GPU Development Tools

    英伟达

    上海市 · 仅现场办公

  • ASIC Physical Design Methodology Engineer

    英伟达

    上海市 · 仅现场办公

  • Developer Technology Engineer – AI

    英伟达

    上海市 · 仅现场办公

  • LLM Reinforcement Learning Framework Engineer

    英伟达

    上海市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公