小红书的【Ace顶尖实习生】交互式进化审核 Agent 系统研究薪资是多少？

该职位薪资范围为 6k–12k（人民币/月）。

【Ace顶尖实习生】交互式进化审核 Agent 系统研究的工作地点在哪里？

该职位工作地点位于北京市、上海市、杭州市。工作形式为仅现场办公。

该职位要求本科学历及无经验要求工作经验。

🤖 AI 估测：¥6K-12K

发布时间：29 天前

这是一个专注于前沿AI技术研究的实习岗位

你将参与构建一个交互式进化审核Agent系统，旨在通过‘教学-纠正’闭环，让AI模型在复杂多变的国际化内容审核场景中实现自主学习和策略优化

核心工作是探索如何将抽象的审核政策自动化解析为可执行的Agent策略，并利用强化学习等技术解决小样本冷启动等难题

工作职责本课题旨在探索一种基于‘教学—纠正’闭环的交互式进化审核 Agent 系统，致力于打破传统审核模型对静态规则与大规模标注样本的依赖，实现‘规则—策略’的自动生成优化反馈闭环

不同于通用 Agent，该系统强调在复杂、多变的国际化内容审核场景中，通过引入 Policy Maker 的实时干预与 Rule Set 的动态反馈，实现从‘规则驱动’向‘智能进化’的范式迁移

研究核心在于构建一套集成经验进化学习、在线学习及 RLRF（基于反馈的强化学习）的复合技术架构

关键问题包括：如何将抽象的审核政策（Policy）自动化解析为可执行的 Agent 策略链路，如何在跨语言、跨文化背景下构建具备自主学习能力的 Agent 基座，以及如何在极度稀疏的违规样本中利用小样本（Few-shot）实现风险域的‘0 人审’冷启动

不限年级，本科及以上在读，计算机/人工智能/软件工程等相关专业优先

优秀的代码能力、数据结构和基础算法功底，熟悉Python等至少一门编程语言

熟悉大模型领域尤其是强化学习相关研究工作和算法，有大模型强化学习的研发基础

良好的沟通协作能力，责任心强，积极主动，能和团队一起探索新技术，推进技术进步

在ICML/CVPR/NeurIPS/ACL等顶级期刊会议上发表论文者优先

【Ace顶尖实习生】交互式进化审核 Agent 系统研究

🤖 AI 估测：¥6K-12K

发布时间：29 天前