Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Kwai logo
快手
【快Star】容器&大模型推理调度研发工程师
立即应聘

【快Star】容器&大模型推理调度研发工程师

发布于 大约 2 小时前

普通员工/个人贡献者

杭州市 / 北京市
中级经验
全职员工
仅现场办公
本科
GPU
调度
容器
NPU
云原生
大模型推理
Ai Infra

AI 估算 · 30k–50k

快手为上市大厂,一线城市高级研发薪资约30k-50k,含大模型稀缺方向溢价,15薪体现互联网行业特点。

职位详情

关于这个职位

该职位是快手容器云平台的研发工程师,专注于大模型推理调度和算力优化

你将参与超大规模容器集群的架构设计,推动异构资源(CPU/GPU/NPU)的统一调度与性能优化,直接提升千万核级算力的效率
适合对云原生和大模型基础设施有热情的技术人才

最低要求

本科及以上学历,计算机相关专业,具备快速掌握新技术的能力,不给自己设限

热爱技术,尤其热爱大模型AI基础设施,对云原生、容器调度、大模型推理底层技术有发自内心的好奇与热情,愿意在这个方向持续深耕
扎实的数据结构与算法功底,熟练掌握至少一门语言(Golang/Java等),代码整洁、有设计感
对K8s等云原生生态有深入理解,对大模型技术栈有一定了解,关注业界计算基础设施发展趋势

工作职责

超大规模算力调度:参与快手容器云平台的架构设计与开发,探索面向大模型的资源调度、服务编排、容器引擎等前沿领域,直接驱动千万核级与数十万卡级算力的高效运转

云原生基础设施:基于云原生技术栈,构建海量异构资源(CPU/GPU/NPU)的多集群联邦与统一调度能力,打造低成本、高弹性的大模型算力基座,持续突破资源效率瓶颈
稳定性与性能优化:完善大模型服务微架构分析与性能瓶颈观测体系,深入支撑容器平台及快手推理业务的全链路稳定性问题,让每一毫秒的延迟优化都转化为用户体验的提升
AI-Infra前沿探索:投身云原生与大模型推理的交汇领域,研究GPU混部调度、大模型推理容量预测、实例快速启动等核心技术,让大模型推理的GPU利用效率实现质的飞跃

优先资格

有大规模集群资源调度、AI Infra基建、大模型推理稳定性相关实践经历

AI 洞察

优缺点分析

优点

  • 前沿技术方向:云原生+大模型是当前行业热点,技能稀缺度高
  • 大平台资源:快手拥有海量用户和算力,能接触到超大规模系统设计
  • 成长空间大:涉及算法、系统、硬件等多维度,综合能力提升快
  • 薪资竞争力强:互联网大厂+AI方向,薪酬和福利待遇优厚
  • 技术复杂度高:需要同时掌握容器调度和AI推理技术,学习曲线陡峭
  • 需要不断跟进前沿:AI领域更新快,需持续学习保持竞争力

缺点 / 挑战

  • 工作节奏快:互联网大厂迭代迅速,可能面临较大的项目压力
  • 适合对云原生和大模型充满好奇,喜欢挑战系统级性能优化,愿意在AI基础设施领域长期深耕的技术人才

角色解读

  • 技术深耕:从容器调度专家成长为AI-Infra架构师,主导算力基础设施设计
  • 横向拓展:可转向大模型训练/推理平台、云计算产品管理等方向
  • 管理路线:带领团队负责容器云平台或推理加速项目,向技术Leader发展
  • 设计并实现超大规模容器调度系统,管理千万核级CPU和数十万卡级GPU算力
  • 基于Kubernetes构建多集群联邦,统一调度CPU/GPU/NPU等异构资源
  • 优化大模型推理服务的性能与稳定性,降低延迟、提升资源利用率
  • 探索GPU混部、推理容量预测、实例快速启动等前沿AI-Infra技术
  • 扎实的Golang或Java编程能力,数据结构和算法功底
  • 深入理解Kubernetes及云原生生态,掌握容器调度原理
  • 对大模型推理技术栈有了解,如模型部署、推理引擎等
  • 具备系统性能分析和优化能力,熟悉GPU/NPU等异构计算

申请策略

  • 详细了解快手的容器平台和AI-Infra现状,在面试中展示你的行业认知
  • 关注快手在云原生和大模型方面的技术博客或开源项目,提前准备相关话题
  • 突出Kubernetes相关项目经验,尤其是调度或编排方面的实践
  • 强调大模型推理优化或AI-Infra项目,说明你在其中的具体贡献
  • 展示Golang/Java的代码质量和系统设计能力,最好有开源项目或高并发系统经历
  • 如果有性能调优、资源利用率提升的数据,务必量化呈现
  • 深入学习Kubernetes调度器源码,理解调度算法和扩展机制
  • 学习大模型推理框架(如vLLM、TensorRT-LLM)和GPU底层原理

面试指南

  • 对于系统设计问题,采用“需求分析-架构设计-关键点优化-风险评估”的结构化回答
  • 对于性能优化问题,先讲清楚问题表象和影响范围,再给出可操作的优化措施,并量化预期效果
  • 对于技术原理问题,结合自己的项目经验,从底层原理到上层应用层层递进,展现深度
  • 请详细描述Kubernetes调度器的工作流程,以及如何自定义调度策略
  • 如何优化大模型推理服务的GPU利用率?你有哪些具体方案?
  • 设计一个多集群联邦调度系统,需要考虑哪些关键因素?
  • 你的项目中遇到过哪些容器或推理性能问题?如何解决的?
  • 你认为当前大模型推理基础设施面临的最大挑战是什么?

匹配度报告

74
综合匹配度

头部大厂、AI前沿、技术深度高,但工作节奏快、WLB一般。

适合人群
适合追求技术前沿和快速成长、能接受一定工作强度的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展90
工作生活50
使命价值70

薪资福利匹配

85较高

快手为上市公司,薪酬在互联网行业属第一梯队,且AI方向有溢价,福利待遇完善。

薪资信号未披露(AI估算:30K-50K/月)

成长发展匹配

90较高

该职位处于云原生与大模型交叉前沿,技术挑战大,成长空间广阔,公司资源丰富。

技术前沿前沿/新兴技术
技术栈Kubernetes、Golang、大模型推理、GPU调度、云原生、AI Infra
业务类型profit_center

工作生活匹配

50较低

快手工作节奏较快,未提及弹性办公或远程选项,且地点在杭州/北京核心区域,通勤可能耗时。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

70中等

AI基础设施对社会有重要推动作用,但职位本身偏技术实现,使命感中等。

行业发展高速增长赛道
社会影响正向社会影响力较高
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

快手 的其他在招职位

  • 【快Star】多模态理解算法研究员

    快手 · 深圳市
    AI 估算 · 25k-45k
  • 【快Star】大模型系统开发工程师

    快手 · 北京市
    AI 估算 · 25k-35k
  • 【快Star】数据科学家

    快手 · 北京市
    AI 估算 · 25k-45k
  • 【快Star】具身智能算法研究员

    快手 · 北京市
    AI 估算 · 30k-50k
  • 【快Star】搜索大模型算法工程师

    快手 · 杭州市
    AI 估算 · 30k-60k

快手 的其他在招职位

  • 【快Star】多模态理解算法研究员

    快手 · 深圳市
    AI 估算 · 25k-45k
  • 【快Star】大模型系统开发工程师

    快手 · 北京市
    AI 估算 · 25k-35k
  • 【快Star】数据科学家

    快手 · 北京市
    AI 估算 · 25k-45k
  • 【快Star】具身智能算法研究员

    快手 · 北京市
    AI 估算 · 30k-50k
  • 【快Star】搜索大模型算法工程师

    快手 · 杭州市
    AI 估算 · 30k-60k