Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/小红书/【hi lab】基础模型 Post-Train 研究员
Xiaohongshu logo
X
小红书 (Xiaohongshu)

职位信息

北京市 / 上海市 / 浙江省-杭州市
高级经验
全职员工
仅现场办公
学历未注明
普通员工/个人贡献者

标签

强化学习NeurIPSICLR多模态大语言模型智能体Pytorch/TensorflowPost-Train
💡

核心评价

顶尖大厂AI前沿研究岗,技术成长与意义感极强,薪资竞争力高,但需面对一线城市通勤与研究强度。

【hi lab】基础模型 Post-Train 研究员

🤖 AI 估测:¥45K-80K

发布时间:28 天前

立即应聘

ℹ️关于这个职位

这是一个专注于基础模型Post-Train前沿研究的岗位
你将深入探索强化学习扩展、智能体构建、自我进化与终身学习等方向,旨在提升大模型的推理、规划和持续学习能力
你需要具备扎实的机器学习理论基础和优秀的算法实现能力,解决RL训练中的核心问题,推动模型实现真正的“理解”与“进化”

✓工作职责

在以下一个或多个前沿方向进行深度攻关:
Reasoning & RL Scaling:探索 RL Scaling Law,在数学、编程、视觉推理等可验证任务上提升模型的可泛化推理能力
研发 Adaptive Thinking 技术,使模型具备动态调整思考深度的能力
Agentic Intelligence:构建多模态环境下的规划、工具调用、执行与反思闭环
研究 Multi-agent RL 以应对超长程任务
探索 Proactive AI,使模型具备主动交互与需求澄清能力
Self-Evolving & Intrinsic Motivation:突破人类监督的扩展性瓶颈,研究自我评估与修正机制
探索通过 Intrinsic Reward(内在奖励)替代外部反馈,实现 AI 的持续自我迭代
Lifelong Learning:赋予模型从长期交互中持续学习的 Meta 能力,提升模型在长程对话中的用户理解力与任务解决成功率

⭐最低要求

基础能力:扎实的机器学习与深度学习基础,对大模型模型训练全流程有深入理解
解决问题:具备逻辑严密的分析能力,能够从复杂现象中抽象出底层问题并给出系统性方案
专业能力:具备扎实的机器学习理论基础,能够深刻理解并解决 RL 训练中的各种问题问题,包括 Reward Hacking、Training Stability、Exploration Efficiency等
动手能力:有优秀的算法实现能力和工程性能感知,具备优秀的数据敏锐度,能够从中数据得到让模型效果突破的 insight

👍优先资格

研究成果:在 NeurIPS、ICLR、ICML、CVPR、ACL 等顶级会议发表过高水平研究成果,或主导过知名开源项目优先
敏锐的直觉和探索精神:具备极强的好奇心,能在高度不确定的无人区中通过严谨的实验验证寻找确定性
不满足于优化已有 Benchmark,而是对“模型是否真的在理解、在进化”保持极度敏感
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

小红书 的其他在招职位

  • AI产品运营实习生

    小红书

    上海市 · 仅现场办公

  • 点点AI运营实习生 · AI图像创作

    小红书

    上海市 · 仅现场办公

  • AI Agent算法工程师

    小红书

    北京市 · 仅现场办公

  • 【27届实习】OLAP研发工程师

    小红书

    北京市 · 仅现场办公

  • 【27届实习】Ray研发工程师

    小红书

    北京市 · 仅现场办公

相似职位推荐

  • 多模态实习生

    叠纸游戏

    上海市 · 仅现场办公

  • 大模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 图形图像算法实习生

    叠纸游戏

    图形图像算法实习生 · 仅现场办公

  • 算法工程师(武汉)

    多点数智

    武汉市 · 仅现场办公

  • 算法工程师(北京)

    多点数智

    北京市 · 仅现场办公