Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/英伟达/Senior Solutions Architect, CSP System
Nvidia logo
N
英伟达 (Nvidia)

职位信息

广东省-深圳市 / 北京市
专家级经验
全职员工
仅现场办公
本科
普通员工/个人贡献者

标签

💡

核心评价

英伟达前沿AI基础设施专家岗,薪资顶尖、技术前沿、成长性高,但WLB可能面临挑战。

Senior Solutions Architect, CSP System

🤖 AI 估测:¥60K-100K

发布时间:13 天前

立即应聘

ℹ️关于这个职位

这是一个面向云服务提供商(CSP)的高级解决方案架构师职位,专注于为Agentic AI和Agentic RL工作负载构建、优化和运维基于Kubernetes的基础设施
你将作为技术桥梁,将英伟达的尖端加速计算技术(如NVIDIA AI Enterprise, GB200平台)与中国主流云服务商(如阿里云、腾讯云)的业务需求相结合,设计高性能、可扩展且安全的Agent Infra系统,推动Agentic AI/RL解决方案的落地与规模化

✓工作职责

与销售、业务发展和客户项目经理团队合作,将英伟达技术引入指定客户并相应发展业务
领导针对Agentic AI和Agentic RL工作负载的基于Kubernetes的基础设施解决方案的设计、开发和优化,解决包括大规模并发沙箱调度、毫秒级弹性、安全隔离和全场景交互环境支持在内的核心挑战
与英伟达的CSP合作伙伴(中国主要云服务提供商)紧密合作,了解其Agentic AI/RL业务需求,提供专业的K8s技术指导,并定制符合英伟达加速计算技术(如NVIDIA AI Enterprise、GB200平台和NVCF)的基础设施解决方案
优化Kubernetes集群以支持高吞吐、低延迟的Agentic RL训练和推理工作负载,包括资源调度策略优化、GPU资源管理、网络和存储性能调优,以及解决大规模Pod创建和调度中的瓶颈
基于K8s设计和实现Agent Infra核心组件,例如安全沙箱环境、交互轨迹记录、检查点断点回放和全链路可观测性工具,以支持Agentic AI/RL开发和部署的端到端生命周期
与跨职能团队(英伟达的研发、解决方案架构和技术支持团队)合作,推动K8s与英伟达软硬件生态系统的集成,包括NVIDIA Operators、Dynamo、Grove和KAI Scheduler,以实现Agentic工作负载的最佳性能
在K8s和Agentic AI/RL Infra领域提供技术领导力,指导初级工程师,并基于行业最佳实践和客户反馈推动基础设施解决方案的持续迭代和改进
紧跟Kubernetes、Agentic AI、Agentic RL和云原生基础设施的最新趋势,将先进技术和解决方案引入英伟达的CSP生态系统,推动技术创新和标准化
参与针对CSP合作伙伴的技术售前支持、解决方案演示和技术培训,帮助合作伙伴掌握基于K8s的Agentic AI/RL Infra建设和运营能力

⭐最低要求

计算机科学、软件工程、电气工程或相关专业本科及以上学历
硕士优先
10年以上Kubernetes开发、运维和优化实践经验,对K8s核心组件(kube-apiserver, etcd, kube-scheduler, kubelet)和自定义资源开发(CRD/Operator)有深入理解
具备为AI/ML工作负载构建和优化基础设施的经验,深入理解Agentic AI和Agentic RL概念,有在K8s上支持Agentic RL训练或推理工作负载的实践经验者优先
精通容器化技术(Docker, containerd)、容器网络解决方案(Calico, Cilium)和存储解决方案(Ceph, GlusterFS),具备为高并发AI工作负载优化网络和存储性能的经验
在K8s上拥有丰富的GPU资源管理经验,熟悉NVIDIA GPU Operator、CUDA和加速计算技术,能够为Agentic AI/RL工作负载优化GPU利用率
优秀的编程能力,精通至少一门编程语言(Python, Go, C++),能够开发自定义K8s控制器、插件或自动化工具
深刻理解云原生架构和最佳实践,有与主流CSP(阿里云、腾讯云、华为云等)合作经验者优先
流利的英语口语和书面表达能力,能够与全球跨职能团队有效沟通并阅读英文技术文档
强大的问题解决能力,能够独立识别和解决复杂的K8s及Agentic AI/RL Infra技术问题,积极主动且以结果为导向的工作态度

👍优先资格

有构建Agentic AI/RL沙箱环境的经验,熟悉沙箱技术及其与K8s的集成
有大规模数据中心基础设施管理经验,了解Agentic RL场景中脉冲式工作负载调度和成本优化的挑战
熟悉Agentic AI框架和RL框架,能够将K8s基础设施与框架需求对齐
拥有CKA(Certified Kubernetes Administrator)、CKAD(Certified Kubernetes Application Developer)或CKS(Certified Kubernetes Security Specialist)等相关认证
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

英伟达 的其他在招职位

  • Machine Learning Engineer - Humanoid Robotics

    英伟达

    上海市 · 仅现场办公

  • System Software Engineer, GPU Development Tools

    英伟达

    上海市 · 仅现场办公

  • ASIC Physical Design Methodology Engineer

    英伟达

    上海市 · 仅现场办公

  • Developer Technology Engineer – AI

    英伟达

    上海市 · 仅现场办公

  • LLM Reinforcement Learning Framework Engineer

    英伟达

    上海市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公