
快手
高性能GPU调度推理研发实习生-【可灵AI专项】
高性能GPU调度推理研发实习生-【可灵AI专项】
发布于 大约 2 个月前实习/见习
北京市
无经验要求
实习生
仅现场办公
本科
软件工程
GPU
PyTorch
调度
虚拟化
视频生成
推理
SGLang
vLLM
Containerd
AI 估算 · 4k–8k
大厂实习,前沿技术栈,薪资有竞争力,北京地区互联网实习标准。
职位详情
关于这个职位
该实习岗位加入快手可灵AI核心团队,负责GPU资源调度与推理优化,参与万卡级GPU集群的算力平台建设,通过虚拟化混部、弹性伸缩等技术提升GPU利用率,支撑AI视频生成模型的高效运行
你将接触到业界前沿的AI基础设施技术,适合对系统性能优化和分布式计算感兴趣的同学
最低要求
本科及以上学历,计算机相关专业优先
计算机和编程基础扎实,熟练掌握Java或Python,有服务端系统的开发经验
有较强的工作责任心和自驱力,较好的学习能力和沟通能力,良好的工作文档习惯
熟悉大模型推理或训练框架(如vLLM、SGLang、PyTorch等)
了解 Docker/Containerd 等容器运行时技术原理、理解Kubernetes调度实现
工作职责
参与GPU利用率下钻指标的建设及分析,挖掘潜在的GPU利用率提升手段
通过算力调度策略,协同同步业务的资源供给
参与虚拟化混部技术方案的架构设计和核心代码开发,协同推动方案落地,通过混部和潮汐资源提升面向业务的GPU供给能力
参与模型推理执行优化,设计模型推理执行流水线
AI 洞察
优缺点分析
优点
- 团队技术积累深厚,有成熟的大规模实战场景,能学到业界最佳实践
- 快手作为上市大厂,平台稳定,实习生待遇和福利较好,有转正机会
- 实习任务可能涉及线上系统,需要严谨负责,容错空间小
- 适合对AI基础设施有浓厚兴趣、喜欢解决系统性能问题、愿意在技术深度上钻研的计算机专业学生
缺点 / 挑战
- 接触快手核心AI业务,参与大规模GPU集群调度,技术挑战高,积累经验快
- 技术门槛较高,需要快速掌握GPU调度、虚拟化、分布式系统等知识,学习压力大
- 北京现场办公,通勤和住宿成本较高
角色解读
- 从实习转正,成为GPU集群架构方向的正式员工,深入万卡级平台建设
- 向AI基础设施专家发展,掌握推理优化、调度系统等核心技术
- 积累高性能计算和分布式系统经验,未来可转向芯片厂商或云厂商相关岗位
- 参与GPU利用率下钻分析,从数据中挖掘优化机会,提出并实施提升手段
- 设计算力调度策略,协调多业务资源需求,保障算力高效供给
- 开发虚拟化混部方案,通过潮汐资源提升GPU利用率,参与核心代码编写与落地
- 优化模型推理执行流水线,探索推理加速技术,提升服务性能
- 扎实的编程基础,熟练掌握Java或Python,有服务端开发经验
- 了解大模型推理框架(如vLLM、SGLang、PyTorch)的基本原理
- 熟悉容器化技术(Docker/Containerd)和Kubernetes调度机制
- 具备良好的学习能力和自驱力,能快速理解复杂系统
申请策略
- 在面试中展现对可灵AI产品的了解,关注快手在视频生成领域的动态,体现对业务的思考
- 准备1-2个有深度的技术问题,主动询问团队的技术栈和挑战,展现主动性
- 突出与GPU编程、分布式系统相关的项目或课程实践,如使用CUDA、MPI等
- 展示对vLLM、PyTorch等推理框架的源码阅读或二次开发经历
- 强调Kubernetes或Docker的使用和调优经验,最好有集群管理案例
- 体现数据分析能力,如有性能瓶颈分析或资源利用率优化的项目
- 提前学习vLLM或SGLang的推理调度原理,尝试搭建本地推理服务
- 强化Python/C++性能优化技巧,了解GPU底层架构(如SM、显存管理)
面试指南
- 采用STAR法则(情境-任务-行动-结果)来结构化回答项目经历
- 对于技术原理问题,先给出定义,再分层展开,最后联系实际场景
- 面对开放式问题,先明确问题边界,提出多种方案并比较优劣
- 请解释GPU利用率低的原因有哪些?你会如何系统性地优化?
- 描述Kubernetes调度器的工作流程,如何为GPU资源设计调度策略?
- 大模型推理服务中,如何实现弹性伸缩以应对流量波动?
- vLLM的内存管理机制是怎样的?相比传统方案有什么优势?
- 请举例说明你解决过的性能优化问题,用到了哪些工具和方法?
职位点评
66
综合评分
快手核心AI业务、前沿GPU调度技术、成长极快但需投入较多时间,WLB一般。
更适合这类人
适合极度看重技术成长、希望接触前沿AI基础设施、不介意现场办公和一定工作强度的实习生。
表现最好
成长发展
相对薄弱
工作生活
薪资福利60
成长发展90
工作生活50
使命价值65
薪资福利
60中等
快手大厂平台,实习薪资在互联网中属主流水平,但JD未明确福利,薪资信号中等。
薪资信号未披露(AI估算:4K-8K/月)
成长发展
90较高
技术栈前沿(GPU、Kubernetes、AIGC),核心业务场景,成长空间巨大,是实习岗位的突出优势。
技术前沿前沿/新兴技术
技术栈GPU、Kubernetes、vLLM、PyTorch、AIGC
业务类型profit_center
工作生活
50较低
需北京现场办公,JD未提及加班或弹性工作,作为大厂核心业务实习,工作节奏可能较快。
工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)
使命价值
65中等
AI视频生成是高速增长赛道,技术有创新性,但社会影响力中等,主要服务于公司商业目标。
行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
快手 的其他在招职位
相似职位推荐
Watch Jobs