Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Xiaohongshu logo
小红书
Dots-【Ace顶尖实习生】Long Horizon Agentic Task 能力提升研究
立即应聘

Dots-【Ace顶尖实习生】Long Horizon Agentic Task 能力提升研究

发布于 1 天前

实习/见习

北京市 / 上海市
无经验要求
实习生
仅现场办公
本科
NLP
强化学习
计算机视觉
LLM
多模态
大模型
RL

AI 估算 · 4k–8k

顶尖实习项目,技术前沿,薪资高于普通实习,北京上海生活成本较高。

职位详情

关于这个职位

这是一个面向顶尖实习生的研究型岗位,专注于提升大模型在超长程Agent任务中的自主执行能力,涉及训练与推理侧的关键技术挑战,如RL环境合成、稀疏奖励信用归因、主动规划等

你将参与前沿课题,与优秀团队一起探索AI Agent的未来方向

最低要求

不限年级,本科及以上在读,计算机/人工智能/软件工程等相关专业优先

优秀的代码能力、数据结构和基础算法功底,熟练掌握至少一门编程语言,包括但不限于Python等
有LLM/MLLM等多模态理解技术背景,或大规模模型训练实际项目经验者优先
在TPAMI/CVPR/NeurIPS/ICCV/ICML/ICLR等顶级期刊会议上发表相关论文者优先
良好的沟通协作能力,责任心强,积极主动,能和团队一起探索新技术,推进技术进步

工作职责

本课题聚焦于提升大模型在上百轮交互的超长程 Agent 任务中的自主执行能力,目标场景涵盖 CLI/GUI Computer Use、Software Engineering、科研与专业任务等,并致力于让模型从被动响应指令转变为能够主动推进任务的 Proactive Agent

当前面临的核心挑战贯穿训练与推理两侧:在训练侧,缺乏能够覆盖真实世界复杂性与多样性的 RL 训练环境,现有环境难以模拟长程任务中工具调用、状态变迁与多步依赖的真实分布
稀疏的结果奖励无法为上百步的中间过程提供有效训练信号,如何设计面向长程任务的 Reward Signal 与 Credit Assignment 机制是关键瓶颈
在推理侧,模型在长时执行中面临目标漂移、错误累积与上下文认知负载持续增长等问题,缺乏有效的自我监控与恢复能力
研究将围绕复杂真实多样的 RL 训练环境合成、特定场景下长程稀疏奖励下关键决策步骤的信用归因,以及主动规划与长程目标对齐等核心问题展开

AI 洞察

优缺点分析

优点

  • 研究课题前沿,涉及大模型和Agent最新方向,技术含量高,能快速提升研究能力
  • 实习期间可积累丰富的研究经验,为后续深造或求职提供有力背书
  • 课题难度大,涉及稀疏奖励、信用分配等开放性问题,需要较强的学术背景和钻研精神

缺点 / 挑战

  • 小红书作为头部互联网公司,资源丰富,团队优秀,有较高的业界影响力
  • 实习期可能面临较大研究压力,需要有较强的自驱力和抗压能力
  • 需要同时兼顾工程实现和理论分析,对综合能力要求较高
  • 适合对AI Agent方向有浓厚兴趣、具备扎实的代码和算法能力、有研究经验且渴望挑战前沿问题的顶尖学生

角色解读

  • 从实习生成长为正式研究员,深入Agent方向,成为领域专家
  • 有机会发表顶级会议论文,积累学术影响力,后续可继续攻读博士或进入工业界高级研发岗
  • 培养系统化研究思维和工程落地能力,未来可胜任AI核心算法团队的关键角色
  • 参与大模型在长程Agent任务中的研究与开发,包括RL训练环境合成、奖励信号设计等
  • 探索模型在推理过程中的自我监控与错误恢复机制,提升长程任务的稳定性
  • 与团队协作,将研究成果应用于实际场景,如CLI/GUI Computer Use和软件工程任务
  • 扎实的编程能力(Python),熟悉数据结构和基础算法,能够快速实现研究原型
  • 深入理解大语言模型(LLM)或多模态模型(MLLM),有相关项目或论文经验
  • 了解强化学习(RL)基本原理,有环境构建或奖励设计经验者优先
  • 具有良好的英文文献阅读能力和学术研究能力,能独立探索前沿技术

申请策略

  • 在简历和动机信中表达对长程Agent任务挑战的深刻理解,展示自己的独特思考
  • 提前了解小红书在AI Agent方向的研究布局,准备针对性的问题与建议
  • 突出机器学习/深度学习相关项目经验,尤其是大模型或强化学习方向
  • 列出发表的顶级会议论文或预印本,展示研究能力
  • 强调编程竞赛、开源贡献或复杂系统实现经历,体现工程能力
  • 简要说明对Agent任务的理解或相关探索,体现兴趣匹配度
  • 复习强化学习的核心概念(如PPO、奖励设计、信用分配),阅读相关经典论文
  • 熟悉LLM的推理与训练细节,尝试复现一些Agent相关的工作(如ReAct、AutoGPT)

面试指南

  • 对于研究类问题,采用“问题定义-现有方法局限-你的思路”的结构回答,体现批判性思维
  • 对于项目经历,使用STAR法则(情境-任务-行动-结果),突出你的贡献和学习
  • 对于技术概念,先给出清晰定义,再举例说明,最后联系实际课题
  • 请谈谈你对大模型在长程任务中面临的主要挑战的理解
  • 描述一个你参与过的机器学习项目,尤其是涉及强化学习或大模型的部分
  • 解释什么是信用分配问题?在稀疏奖励场景下有哪些常见解决方法?
  • 你如何设计一个RL环境来评估Agent在长程任务中的性能?
  • 你有阅读过哪些关于Agent或LLM推理的论文?请介绍其中一篇的核心思想

匹配度报告

61
综合匹配度

顶尖实习,前沿Agent研究,技术成长极高,但工作强度和不确定性较大。

适合人群
最看重技能成长和前沿技术探索的求职者,能接受较高工作强度且追求长期发展。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利50
成长发展95
工作生活30
使命价值70

薪资福利匹配

50较低

实习岗位薪资一般,无明确福利信息,但对顶尖实习生可能有一定激励,补偿性动机满足有限。

薪资信号未披露(AI估算:4K-8K/月)

成长发展匹配

95较高

岗位聚焦前沿AI研究,技术栈先进,有机会发表论文,成长空间极大,发展性动机高度满足。

技术前沿前沿/新兴技术
技术栈LLM、MLLM、强化学习、Agent、RLHF
业务类型ambiguous

工作生活匹配

30较低

实习通常需要现场办公,且研究性工作强度可能较大,生活化动机满足程度低。

工作模式未明确
办公地点未明确
加班情况未提及(无法判断)

使命价值匹配

70中等

AI Agent方向符合技术发展趋势,有一定的社会价值,但具体使命感不强,意义感动机中等。

行业发展高速增长赛道
社会影响中性/一般
创新程度开拓性创新(行业首创)
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

小红书 的其他在招职位

  • 内容安全引擎架构师

    小红书 · 北京市
    AI 估算 · 50k-80k
  • 生态线索行业运营实习生

    小红书 · 广州市
    AI 估算 · 2k-4k
  • 模型开发工程师

    小红书 · 杭州市
    AI 估算 · 35k-55k
  • 安吉乡村文旅项目负责人

    小红书 · 湖州市
    AI 估算 · 18k-30k
  • 行政运营(设备设施管理)

    小红书 · 武汉市
    AI 估算 · 15k-25k

相似职位推荐

  • 医疗行业解决方案架构师-火山引擎

    字节跳动 · 北京市
    AI 估算 · 35k-65k
  • 3D视觉仿真工程师/专家-PICO

    字节跳动 · 北京市
    AI 估算 · 35k-65k
  • 多媒体算法工程师(AI Infra)-视频与边缘

    字节跳动 · 上海市
    AI 估算 · 35k-65k
  • 开发工程师

    中国移动 · 贵阳市
    AI 估算 · 12k-20k
  • 多媒体算法工程师(AI Infra)-视频与边缘

    字节跳动 · 深圳市
    AI 估算 · 30k-60k

小红书 的其他在招职位

  • 内容安全引擎架构师

    小红书 · 北京市
    AI 估算 · 50k-80k
  • 生态线索行业运营实习生

    小红书 · 广州市
    AI 估算 · 2k-4k
  • 模型开发工程师

    小红书 · 杭州市
    AI 估算 · 35k-55k
  • 安吉乡村文旅项目负责人

    小红书 · 湖州市
    AI 估算 · 18k-30k
  • 行政运营(设备设施管理)

    小红书 · 武汉市
    AI 估算 · 15k-25k

相似职位推荐

  • 医疗行业解决方案架构师-火山引擎

    字节跳动 · 北京市
    AI 估算 · 35k-65k
  • 3D视觉仿真工程师/专家-PICO

    字节跳动 · 北京市
    AI 估算 · 35k-65k
  • 多媒体算法工程师(AI Infra)-视频与边缘

    字节跳动 · 上海市
    AI 估算 · 35k-65k
  • 开发工程师

    中国移动 · 贵阳市
    AI 估算 · 12k-20k
  • 多媒体算法工程师(AI Infra)-视频与边缘

    字节跳动 · 深圳市
    AI 估算 · 30k-60k