Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/快手/强化学习算法工程师/专家
Kwai logo
K
快手 (Kwai)

职位信息

北京市
专家级经验
全职员工
仅现场办公
学历未注明
普通员工/个人贡献者

标签

强化学习NeurIPSICMLICLR系统工程算法优化大语言模型Pytorch/Tensorflow
💡

核心评价

前沿AI大厂核心岗,技术成长性极佳,薪资竞争力强,但需接受现场办公且WLB未知。

强化学习算法工程师/专家

🤖 AI 估测:¥40K-80K

发布时间:19 天前

立即应聘

ℹ️关于这个职位

该职位是快手Kwaipilot团队的强化学习算法工程师/专家,专注于大语言模型(LLM)的前沿技术研究与落地
你将负责通过算法创新与系统工程,刷新Agent的能力边界,并参与大规模训练的算法-基建联合优化,目标是达到世界领先水平

✓工作职责

通过算法创新与系统工程,刷新Agent的能力边界,效果达到世界领先水平
专注于大语言模型(LLM)的前沿技术研究与技术落地,包括但不限于RL,Agent等方向
负责大规模训练的算法-基建联合优化

⭐最低要求

对大规模RL训练有实践经验,或者对context engineering、博弈论、多智能体、long-horizon、下一代RL范式等理论有深入理解者优先
在顶级会议(如NeurIPS、ICML、ICLR等)发表过高质量论文者优先
有强大的工程实现能力者优先
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

快手 的其他在招职位

  • 履约体验运营-【电商】

    快手

    杭州市 · 仅现场办公

  • 【留用实习】大模型AI Infra底软/硬件加速工程师

    快手

    上海市 · 仅现场办公

  • 大模型AI Infra底软/硬件加速工程师

    快手

    北京市 · 仅现场办公

  • 【留用实习】策略产品经理-社区治理

    快手

    北京市 · 仅现场办公

  • 【快Star-X】大模型AI Infra底软/硬件加速工程师

    快手

    北京市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公