Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/快手/大模型强化学习研发实习生
Kwai logo
K
快手 (Kwai)

职位信息

上海市 / 北京市
无经验要求
实习生
仅现场办公
本科
实习/见习

标签

PyTorch强化学习GPU编程大语言模型SGLangPPOMegatronGrpo
💡

核心评价

前沿AI技术实习岗,技能成长性极佳,薪资符合实习生市场水平,工作地点与模式未明确弹性。

大模型强化学习研发实习生

🤖 AI 估测:¥6K-12K

发布时间:19 天前

立即应聘

ℹ️关于这个职位

这是一个面向大模型与强化学习(LLM+RL)方向的研发实习岗位
你将参与强化学习框架的设计与开发,致力于提升框架的稳定性和训练效率,并探索前沿的RL工程实践
这是一个深入AI核心领域、积累一线工程经验的机会

✓工作职责

参与强化学习框架研发,聚焦LLM+RL方向,参与RL框架设计和研发,提升框架稳定性和效率
优化强化学习框架性能,如训练速度和显存占用,支撑业务方大规模强化学习训练
关注前沿RL工程实践,探索RL新范式

⭐最低要求

计算机、数学、自动化、人工智能等相关专业优先,本科及以上学历
熟悉强化学习流程,包括但是不限于PPO、GRPO等算法
良好的C++/PyTorch工程能力,精通数据结构和常用的算法

👍优先资格

熟悉PyTorch和GPU编程优先,熟悉Megatron和SGLang框架优先
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

快手 的其他在招职位

  • 履约体验运营-【电商】

    快手

    杭州市 · 仅现场办公

  • 【留用实习】大模型AI Infra底软/硬件加速工程师

    快手

    上海市 · 仅现场办公

  • 大模型AI Infra底软/硬件加速工程师

    快手

    北京市 · 仅现场办公

  • 【留用实习】策略产品经理-社区治理

    快手

    北京市 · 仅现场办公

  • 【快Star-X】大模型AI Infra底软/硬件加速工程师

    快手

    北京市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公