Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/快手/(大模型专项)强化学习算法实习生
Kwai logo
K
快手 (Kwai)

职位信息

北京市
初级经验
实习生
仅现场办公
硕士
实习/见习

标签

PyTorch强化学习NeurIPSICMLICLRTensorFlow多模态算法研发大模型
💡

核心评价

大厂顶尖AI实习,技术前沿成长快,薪资未明需现场办公。

(大模型专项)强化学习算法实习生

🤖 AI 估测:¥8K-15K

发布时间:20 天前

立即应聘

ℹ️关于这个职位

这是一个专注于大模型强化学习算法研发的实习岗位
你将参与前沿强化学习技术的研究与落地,针对多模态大模型场景优化训练效果和效率,并探索解决奖励函数设计、稀疏奖励等关键技术挑战

✓工作职责

支持大模型强化学习算法研发,负责设计并实现核心强化学习策略,针对多模态大模型场景优化训练效果、稳定性及效率
前沿强化学习技术研究与落地,深入追踪强化学习领域最新进展
结合公司核心业务场景,探索创新算法方向并主导技术应用转化,确保技术领先性
大模型强化学习核心技术探索,聚焦大模型在强化学习阶段的关键技术挑战(如奖励函数设计、稀疏奖励、探索效率、泛化能力等),提升模型解决复杂任务的能力
技术沉淀与知识共享,撰写高质量技术报告与研究论文,积极进行内外部技术分享,促进团队技术成长与影响力提升

⭐最低要求

计算机科学与技术、机器学习、人工智能或相关专业,硕士及以上学历
具备扎实的机器学习/深度学习理论基础,精通至少一种主流深度学习框架(如PyTorch, TensorFlow)
拥有强化学习相关的项目实践经验
具备严谨的实验设计、数据分析及解决复杂技术难题的能力
对技术创新充满热情,能主动探索和突破技术边界
具备优秀的技术表达能力和团队协作精神,能有效推动跨团队合作

👍优先资格

符合以下条件者优先:在NeurIPS/ICML/ICLR等顶级机器学习/人工智能会议发表论文
深度参与或主导过有影响力的AI(开源或闭源)项目
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

快手 的其他在招职位

  • 履约体验运营-【电商】

    快手

    杭州市 · 仅现场办公

  • 【留用实习】大模型AI Infra底软/硬件加速工程师

    快手

    上海市 · 仅现场办公

  • 大模型AI Infra底软/硬件加速工程师

    快手

    北京市 · 仅现场办公

  • 【留用实习】策略产品经理-社区治理

    快手

    北京市 · 仅现场办公

  • 【快Star-X】大模型AI Infra底软/硬件加速工程师

    快手

    北京市 · 仅现场办公

相似职位推荐

  • 多模态实习生

    叠纸游戏

    上海市 · 仅现场办公

  • 大模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 图形图像算法实习生

    叠纸游戏

    图形图像算法实习生 · 仅现场办公

  • 算法工程师(武汉)

    多点数智

    武汉市 · 仅现场办公

  • 算法工程师(北京)

    多点数智

    北京市 · 仅现场办公