Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/快手/大模型训练工程师(LLM Training Engineer)
Kwai logo
K
快手 (Kwai)

职位信息

北京市 / 上海市 / 广东省-深圳市 / 浙江省-杭州市
高级经验
全职员工
仅现场办公
本科
普通员工/个人贡献者

标签

PyTorch强化学习CUDA性能调优分布式训练Megatron-LMDeepSpeedRLHFGPU/NPU
💡

核心评价

技术前沿的大厂核心岗,薪资竞争力强,成长空间巨大,但WLB可能面临挑战。

大模型训练工程师(LLM Training Engineer)

🤖 AI 估测:¥45K-80K

发布时间:20 天前

立即应聘

ℹ️关于这个职位

该职位是快手AI基础设施团队的大模型训练工程师,你将负责研发和优化支撑万亿级参数模型训练的平台与框架
核心工作聚焦于分布式训练、性能调优、稳定性建设以及强化学习对齐等前沿技术,目标是让大模型的训练更快、推理更省、交付更稳

✓工作职责

负责大模型训练框架与训练平台的研发与演进,支撑万亿级参数模型训练落地
负责分布式训练方案设计与优化(DP/TP/PP/ZeRO/FSDP/MoE 等),提升吞吐与资源利用率
负责训练性能调优,包括算子优化、混合精度(BF16/FP16/FP8)、显存优化、通信优化与 pipeline overlap
负责训练稳定性建设,包括容错恢复、监控告警、性能回归、训练诊断与自动化运维能力
参与强化学习训练框架与对齐训练流程建设,支持 RLHF/PPO/DPO/GRPO 等训练任务的工程优化与平台化落地
跟进前沿训练系统技术,推动在业务场景规模化落地

⭐最低要求

本科及以上学历,计算机/软件/电子相关专业
熟练掌握 Python/C++,具备扎实的工程能力与系统调试能力
熟悉 PyTorch 训练机制,理解反向传播、梯度同步、显存管理等原理
熟悉分布式训练框架(Megatron-LM/DeepSpeed/FSDP 等)并具备实战经验
熟悉 GPU/NPU 性能优化方法,能独立完成 profiling 与瓶颈定位(Nsight/perf 等)
熟悉训练侧算力优化技术,包括算子融合、图优化、Triton/CUDA Kernel 开发、编译器优化等
了解强化学习训练基本流程与常见框架,熟悉 rollout、reward model、policy update 等机制者优先
具备良好的问题分析能力与跨团队协作能力

👍优先资格

有 MoE/长序列/多机多卡大规模训练经验
熟悉 NCCL/HCCL/RDMA/IB 通信优化
有量化训练、低比特训练或 QAT(Quantization-Aware Training)相关实践经验
有国产卡适配与性能优化经验(昇腾/寒武纪/沐曦等)
有开源贡献或高性能系统相关论文/专利
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

快手 的其他在招职位

  • 履约体验运营-【电商】

    快手

    杭州市 · 仅现场办公

  • 【留用实习】大模型AI Infra底软/硬件加速工程师

    快手

    上海市 · 仅现场办公

  • 大模型AI Infra底软/硬件加速工程师

    快手

    北京市 · 仅现场办公

  • 【留用实习】策略产品经理-社区治理

    快手

    北京市 · 仅现场办公

  • 【快Star-X】大模型AI Infra底软/硬件加速工程师

    快手

    北京市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公