Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/快手/【快Star-X】大模型AI Infra底软/硬件加速工程师
Kwai logo
K
快手 (Kwai)

职位信息

北京市
高级经验
全职员工
仅现场办公
本科
普通员工/个人贡献者

标签

GPUPyTorchXLACUDASGLangSDvLLMFSDPMegatronXccl
💡

核心评价

大厂核心AI Infra岗位,前沿技术栈,薪资优厚,但工作强度大,WLB一般。

【快Star-X】大模型AI Infra底软/硬件加速工程师

🤖 AI 估测:¥40K-70K

发布时间:1 天前

立即应聘

ℹ️关于这个职位

该职位负责快手视频生成大模型在最新硬件平台上的训练/推理性能分析与优化,目标是达到硬件极限性能
同时需要分析并提升大规模分布式训练系统的集群性能,进行故障根因定位与稳定性提升
适合对GPU底层优化和分布式系统有深入理解的资深工程师

✓工作职责

负责视频生成大模型/多模态大模型在最新硬件平台上的训练/推理性能分析与优化,目标达成该硬件平台上的极限性能
负责分析并提升大规模分布式训练系统的集群性能,完成对大规模训练任务故障的根因定位与稳定性提升

⭐最低要求

掌握Python/C++编程语言,熟练使用Pytorch训练框架或SGlang/vLLM等大模型推理框架
掌握大模型领域基础算法知识,熟悉常规Transformer/SD模型结构,以及对应的常用性能优化方法
深刻理解GPU硬件体系结构,能熟练编写高性能cuda kernel

👍优先资格

有分布式大模型训练框架(Megatron/FSDP)或分布式推理引擎开发经验者优先
有在超节点硬件环境上,做过训练/推理性能优化者优先
有GPU高性能算子库(Cutlass/Cute、PTX、汇编)、集合通信库(xCCL)、AI编译器(XLA/Dynamo)开发经验者优先
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

快手 的其他在招职位

  • 履约体验运营-【电商】

    快手

    杭州市 · 仅现场办公

  • 【留用实习】大模型AI Infra底软/硬件加速工程师

    快手

    上海市 · 仅现场办公

  • 大模型AI Infra底软/硬件加速工程师

    快手

    北京市 · 仅现场办公

  • 【留用实习】策略产品经理-社区治理

    快手

    北京市 · 仅现场办公

  • 大模型后训练算法专家(coding方向)

    快手

    北京市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公