Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/快手/GPU混部调度研发工程师-【可灵AI专项】
Kwai logo
K
快手 (Kwai)

职位信息

北京市
中级经验
全职员工
仅现场办公
本科
普通员工/个人贡献者

标签

PyTorch系统架构容器技术AI推理vLLMGPU调度
💡

核心评价

快手核心AI算力平台岗,技术前沿、薪资竞争力强、成长空间大,但需面对现场办公和可能的快节奏工作。

GPU混部调度研发工程师-【可灵AI专项】

🤖 AI 估测:¥35K-60K

发布时间:16 天前

立即应聘

ℹ️关于这个职位

这是一个专注于提升GPU资源利用效率的研发工程师岗位
你将负责快手可灵AI视频生成模型的在线推理服务,通过混部调度、弹性伸缩等技术优化万卡级GPU算力平台,目标是实现GPU利用率的高水位,为AI业务提供坚实的算力基石

✓工作职责

参与GPU利用率下钻指标的建设及分析,挖掘潜在的GPU利用率提升手段
通过算力调度策略,协同同步业务的资源供给
参与虚拟化混部技术方案的架构设计和核心代码开发,协同推动方案落地,通过混部和潮汐资源提升面向业务的GPU供给能力
参与模型推理执行优化,设计模型推理执行流水线

⭐最低要求

本科及以上学历,计算机相关专业优先
计算机和编程基础扎实,熟练掌握Java或Python,有服务端系统的开发经验
有较强的工作责任心和自驱力,较好的学习能力和沟通能力,良好的工作文档习惯
熟悉大模型推理或训练框架(如vLLM、SGLang、PyTorch等)
了解 Docker/Containerd 等容器运行时技术原理、理解Kubernetes调度实现
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

快手 的其他在招职位

  • 履约体验运营-【电商】

    快手

    杭州市 · 仅现场办公

  • 【留用实习】大模型AI Infra底软/硬件加速工程师

    快手

    上海市 · 仅现场办公

  • 大模型AI Infra底软/硬件加速工程师

    快手

    北京市 · 仅现场办公

  • 【留用实习】策略产品经理-社区治理

    快手

    北京市 · 仅现场办公

  • 【快Star-X】大模型AI Infra底软/硬件加速工程师

    快手

    北京市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公