Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Xiaohongshu logo
小红书
大模型 GPU 调度研发工程师(练习生)
立即应聘

大模型 GPU 调度研发工程师(练习生)

发布于 大约 21 小时前

实习/见习

北京市 / 上海市
无经验要求
实习生
仅现场办公
学历未注明
GO
资源管理
云原生
大模型
GPU调度
弹性伸缩
Volcano

AI 估算 · 8k–12k

大厂实习薪资较高,GPU调度缺口大,竞争力强。

职位详情

关于这个职位

该职位专注于小红书大模型平台的GPU资源调度与治理,你将参与万卡级集群的调度优化、弹性策略及可观测体系建设

适合对云原生、分布式系统和AI基础设施有浓厚兴趣的在校生,能深入接触前沿技术栈

最低要求

计算机、软件工程、人工智能等相关专业在校生,具备扎实的编程基础和计算机系统基础

熟悉 Go/Python/Java 中至少一门语言,具备良好的代码能力和工程实现意识
熟悉 Linux,了解 Docker/Kubernetes 等云原生技术栈,对 K8s Scheduler、Volcano、Kueue、Kubeflow、Argo Workflows 等调度系统有兴趣或实践经验
理解分布式系统基本概念,了解服务发现、资源隔离、任务调度、故障恢复、弹性伸缩、监控告警等能力
对大模型训练、后训练、推理、部署等流程有兴趣,愿意理解不同 AI 负载对 GPU、网络、存储和调度策略的差异化诉求
具备较好的数据分析、问题定位、沟通协作和自驱能力,能熟练使用 Cursor、Claude Code、GitHub Copilot 等 AI 工具辅助研发

工作职责

参与内部大模型平台 QuickSilver 的 GPU 资源调度与治理模块研发,完成调度策略、后端服务和资源可视化功能交付

参与 Quota 管理、资源配额、资源申请、资源回收、资源出借等能力建设,支持多业务、多团队、多集群资源管理
参与万卡规模 GPU 集群调度优化,围绕资源分配率、GPU 利用率、任务等待时长、资源碎片等指标提升集群效率
参与训练、后训练、推理等负载下的弹性调度建设,探索潮汐调度、抢占调度、在线/离线混部、低峰缩容、高峰预扩容等策略
参与多机房、多集群、多卡型、GPU/NPU 等异构资源调度能力建设,结合网络、存储、通信拓扑优化调度策略
参与 GPU 资源可观测体系建设,并将调度能力与大模型训练、推理、部署、评估链路结合,提升 AI 生产效率和平台稳定性

优先资格

接触过 Kubernetes Scheduler、Volcano、Kueue、Kubeflow、Ray、OpenKruise、联邦集群等云原生或调度系统

有 GPU 集群、资源调度、Quota 管理、资源利用率分析、在线/离线混部、抢占调度、潮汐调度、弹性伸缩等实践经验
有大模型训练、推理、部署平台使用或开发经验,了解 PyTorch、DeepSpeed、Megatron、vLLM、SGLang 等框架
了解 RDMA、IB、RoCE、NCCL、网络拓扑、存储性能等基础知识,理解其对大规模训练和推理调度的影响
有优秀个人开源项目、技术博客,或曾利用 AI 工具独立交付云原生、调度、平台类项目
有资源利用率分析、监控指标看板、任务画像分析、调度策略评估等经验,能通过数据驱动系统优化

AI 洞察

优缺点分析

优点

  • 前沿技术栈:接触大模型、Kubernetes、GPU调度等热门领域
  • 大厂平台:小红书资源丰富,有机会参与万卡级集群优化
  • 成长迅速:AI基础设施方向人才稀缺,职业前景广阔
  • 工具链完善:鼓励使用AI辅助开发,提升效率
  • 技术深度高:需要理解分布式系统、网络拓扑、调度算法等复杂知识
  • 竞争激烈:大厂实习招聘门槛高,需扎实基础
  • 适合对云原生和AI基础设施有强烈兴趣、动手能力强、愿意深入底层技术的在校生

缺点 / 挑战

  • 实习期短:需快速上手并交付,有一定压力

角色解读

  • 从调度模块入手,深入云原生和AI基础设施,成为GPU调度专家
  • 可向AI平台架构师或分布式系统专家发展,覆盖训练、推理全链路
  • 在大厂积累大规模集群经验,未来可转型技术管理或创业
  • 参与大模型平台GPU资源调度模块的研发,实现调度策略和可视化功能
  • 负责Quota管理、资源申请回收等能力建设,支撑多团队多集群资源管理
  • 优化万卡级GPU集群调度,提升资源分配率、利用率和任务效率
  • 探索弹性调度策略,包括潮汐调度、抢占调度及混部方案
  • 扎实的编程基础,精通Go/Python之一,熟悉Linux和Docker/Kubernetes
  • 理解分布式系统概念,掌握服务发现、资源隔离、任务调度等能力
  • 对调度系统如K8s Scheduler、Volcano有实践或浓厚兴趣
  • 对大模型训练推理流程有了解,能理解不同负载的差异化需求

申请策略

  • 关注小红书技术博客,了解QuickSilver平台特点
  • 在简历中展现对AI工具(如Copilot)的熟练使用
  • 突出分布式系统项目或课程设计,如Kubernetes调度器实践
  • 强调编程语言功底,尤其是Go或Python的工程经验
  • 展示对大模型或GPU集群的了解,如使用过PyTorch、DeepSpeed等
  • 列出开源贡献或技术博客,证明自驱力
  • 深入学习Kubernetes调度框架和Volcano项目
  • 动手实验GPU集群资源监控与调度策略优化

面试指南

  • 从实际案例出发,结合调度算法和系统设计阐述
  • 分步骤分析:先定位问题,再设计方案,最后评估效果
  • 突出对权衡(如利用率vs等待时长)的思考
  • 解释Kubernetes调度器的工作原理,如何实现自定义调度策略?
  • 如何优化GPU集群的资源利用率?举例说明
  • 描述一个你解决过的分布式系统问题,使用了哪些技术?
  • 你对大模型训练中的弹性调度有何理解?
  • 如何在多租户环境中管理资源配额?

匹配度报告

65
综合匹配度

大厂实习、前沿技术栈、成长空间极大,但需现场办公且加班情况不明。

适合人群
最看重技术成长和前沿领域发展的在校生,对工作强度有较高容忍度。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利60
成长发展90
工作生活40
使命价值70

薪资福利匹配

60中等

薪资在实习中较高,但作为实习岗位稳定性与福利相对有限。

薪资信号未披露(AI估算:8K-12K/月)

成长发展匹配

90较高

岗位技术前沿,涉及云原生、GPU调度、大模型等,成长空间极大。

技术前沿前沿/新兴技术
技术栈GPU调度、Kubernetes、Go、Python、大模型、云原生、弹性伸缩、Volcano
业务类型profit_center

工作生活匹配

40较低

实习通常需要现场办公,但未明确WLB信息。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值匹配

70中等

AI基础设施建设对社会智能化有推动,但直接社会影响有限。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

小红书 的其他在招职位

  • 作者产品运营(深圳/上海/北京)

    小红书 · 北京市
    AI 估算 · 20k-35k
  • about编辑部实习生(内容运营&策划方向)

    小红书 · 上海市
    AI 估算 · 4k-6k
  • BaaS 平台研发实习生-存储&数据库部

    小红书 · 上海市
    AI 估算 · 4k-8k
  • 组织文化部活动运营实习生

    小红书 · 北京市
    AI 估算 · 6k-8k
  • 治理策略经营分析专家-T&S

    小红书 · 北京市
    AI 估算 · 25k-45k

相似职位推荐

  • 信安-后端高级开发工程师(J29230)

    58同城 · 北京市
    AI 估算 · 25k-40k
  • 高级引擎开发工程师(开放世界/SOC) 急招

    莉莉丝 · 上海市
    AI 估算 · 25k-45k
  • 测试工程师

    中国融通集团 · 上海市
    AI 估算 · 8k-15k
  • Keeta 技术 - AI 全栈开发专家

    美团 · 北京市
    AI 估算 · 30k-50k
  • 机器人-数据平台架构师

    美团 · 深圳市
    AI 估算 · 35k-60k

小红书 的其他在招职位

  • 作者产品运营(深圳/上海/北京)

    小红书 · 北京市
    AI 估算 · 20k-35k
  • about编辑部实习生(内容运营&策划方向)

    小红书 · 上海市
    AI 估算 · 4k-6k
  • BaaS 平台研发实习生-存储&数据库部

    小红书 · 上海市
    AI 估算 · 4k-8k
  • 组织文化部活动运营实习生

    小红书 · 北京市
    AI 估算 · 6k-8k
  • 治理策略经营分析专家-T&S

    小红书 · 北京市
    AI 估算 · 25k-45k

相似职位推荐

  • 信安-后端高级开发工程师(J29230)

    58同城 · 北京市
    AI 估算 · 25k-40k
  • 高级引擎开发工程师(开放世界/SOC) 急招

    莉莉丝 · 上海市
    AI 估算 · 25k-45k
  • 测试工程师

    中国融通集团 · 上海市
    AI 估算 · 8k-15k
  • Keeta 技术 - AI 全栈开发专家

    美团 · 北京市
    AI 估算 · 30k-50k
  • 机器人-数据平台架构师

    美团 · 深圳市
    AI 估算 · 35k-60k