Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/快手/【快Star-X实习】大模型AI Infra底软/硬件加速工程师
Kwai logo
K
快手 (Kwai)

职位信息

北京市 / 上海市
专家级经验
实习生
仅现场办公
硕士
实习/见习

标签

GPUPyTorchCUDA分布式训练SGLangvLLMSd模型
💡

核心评价

快手大模型AI Infra实习,技术前沿、成长空间大,但工作强度高、WLB一般。

【快Star-X实习】大模型AI Infra底软/硬件加速工程师

🤖 AI 估测:¥6K-10K

发布时间:1 天前

立即应聘

ℹ️关于这个职位

该实习职位专注于大模型AI基础设施的底层软件与硬件加速,你将参与视频生成/多模态大模型在最新硬件平台上的训练与推理性能优化,目标是达到极限性能
同时需要分析大规模分布式训练系统的集群性能,定位故障根因并提升稳定性
适合对GPU底层编程和分布式系统有浓厚兴趣的同学

✓工作职责

负责视频生成大模型/多模态大模型在最新硬件平台上的训练/推理性能分析与优化,目标达成该硬件平台上的极限性能
负责分析并提升大规模分布式训练系统的集群性能,完成对大规模训练任务故障的根因定位与稳定性提升

⭐最低要求

掌握Python/C++编程语言,熟练使用Pytorch训练框架或SGlang/vLLM等大模型推理框架
掌握大模型领域基础算法知识,熟悉常规Transformer/SD模型结构,以及对应的常用性能优化方法
深刻理解GPU硬件体系结构,能熟练编写高性能cuda kernel

👍优先资格

有分布式大模型训练框架(Megatron/FSDP)或分布式推理引擎开发经验者优先
有在超节点硬件环境上,做过训练/推理性能优化者优先
有GPU高性能算子库(Cutlass/Cute、PTX、汇编)、集合通信库(xCCL)、AI编译器(XLA/Dynamo)开发经验者优先
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

快手 的其他在招职位

  • 履约体验运营-【电商】

    快手

    杭州市 · 仅现场办公

  • 【留用实习】大模型AI Infra底软/硬件加速工程师

    快手

    上海市 · 仅现场办公

  • 大模型AI Infra底软/硬件加速工程师

    快手

    北京市 · 仅现场办公

  • 【留用实习】策略产品经理-社区治理

    快手

    北京市 · 仅现场办公

  • 【快Star-X】大模型AI Infra底软/硬件加速工程师

    快手

    北京市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公