Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/小红书/Hi Lab-【Ace顶尖实习生】探索面向复杂场景的可拓展大规模强化学习系统
Xiaohongshu logo
X
小红书 (Xiaohongshu)

职位信息

北京市 / 上海市 / 浙江省-杭州市
无经验要求
实习生
仅现场办公
本科
实习/见习

标签

数据结构算法强化学习LLM多模态理解AI系统大规模模型训练可解释Ai
💡

核心评价

顶尖AI研究实习,技术前沿性拉满,发展潜力巨大,适合为长期职业发展牺牲短期舒适度的探索者。

Hi Lab-【Ace顶尖实习生】探索面向复杂场景的可拓展大规模强化学习系统

🤖 AI 估测:¥6K-12K

发布时间:29 天前

立即应聘

ℹ️关于这个职位

这是一个面向顶尖在校生的强化学习研究实习岗位
你将参与研发面向复杂场景的可拓展大规模强化学习系统,探索AI从被动工具转变为主动协作者的路径
工作内容包括构建大规模奖励系统、研究递归自我增强方法、探索人机合作博弈机制,并关注强化学习进程中的模型可解释性

✓工作职责

本课题的研究目标是研发面向复杂场景的可拓展大规模强化学习系统
包括不限于:
超大规模Reward System构建
面向复杂场景构建“策略与反馈一体化”的递归自我增强方法,解决“AI超越人类”时的可拓展监督问题
面向长程任务探索人机合作博弈的强化学习机制,实现模型在超长程复杂任务上的需求明确、自我规划与执行校验能力
让AI从被动完成指令的工具转变为主动推动任务进展的的协作者,实现目标对齐
强化学习进程中的大模型可解释性、可理解性

⭐最低要求

不限年级,本科及以上在读,计算机/人工智能/软件工程等相关专业优先
优秀的代码能力、数据结构和基础算法功底,熟练掌握至少一门编程语言,包括但不限于Python等
良好的沟通协作能力,责任心强,积极主动,能和团队一起探索新技术,推进技术进步

👍优先资格

有LLM/MLLM等多模态理解技术背景,或大规模模型训练实际项目经验者优先
在TPAMI/CVPR/NeurIPS/ICCV/ICML/ICLR等顶级期刊会议上发表相关论文者优先
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

小红书 的其他在招职位

  • AI产品运营实习生

    小红书

    上海市 · 仅现场办公

  • 点点AI运营实习生 · AI图像创作

    小红书

    上海市 · 仅现场办公

  • AI Agent算法工程师

    小红书

    北京市 · 仅现场办公

  • 【27届实习】OLAP研发工程师

    小红书

    北京市 · 仅现场办公

  • 【27届实习】Ray研发工程师

    小红书

    北京市 · 仅现场办公

相似职位推荐

  • 多模态实习生

    叠纸游戏

    上海市 · 仅现场办公

  • 大模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 图形图像算法实习生

    叠纸游戏

    图形图像算法实习生 · 仅现场办公

  • 算法工程师(武汉)

    多点数智

    武汉市 · 仅现场办公

  • 算法工程师(北京)

    多点数智

    北京市 · 仅现场办公