Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业定价
我的收藏免费试用登录注册

Xiaomi logo
小米
Use Agent 实习生— 环境合成与RL训练方向-2027届
立即应聘

Use Agent 实习生— 环境合成与RL训练方向-2027届

发布于 大约 7 小时前

实习/见习

武汉市
无经验要求
实习生
仅现场办公
本科
研究与开发 (研发)
PyTorch
强化学习
多模态大模型
RL训练
自动化评测
Gui Agent
Computer-Use Agent
环境合成

AI 估算 · 4k–6k

顶级大厂AI研究实习,技能要求高,薪资具有竞争力

职位详情

关于这个职位

这是一个面向2027届学生的AI Agent研究方向实习岗位,主要参与GUI Agent的环境合成与强化学习训练闭环建设

你将跟踪前沿技术,设计模拟任务环境,构建数据生产流程,并持续提升模型的任务完成率和泛化性
适合对多模态大模型、强化学习和自动化评测有强烈兴趣的同学

最低要求

在读本科高年级、硕士或博士,计算机、人工智能、软件工程、自动化、电子信息、数学等相关专业优先

对 GUI Agent、Computer-Use Agent、多模态大模型、强化学习、环境合成、自动化评测等方向有较强兴趣,愿意持续跟踪前沿论文和开源项目
具备优秀的编程和工程实现能力,熟练掌握 Python 或 C++,熟悉 PyTorch 等至少一种深度学习框架
具备良好的实验分析和文档表达能力,能够独立阅读论文、复现方法、分析实验结果并沉淀技术方案
了解或熟悉至少一种自动化、环境构建或 Agent 开发相关技术,例如 Playwright、Selenium、ADB、uiautomator2、Appium、FastAPI、Docker 等,能够参与 GUI 任务环境、评测工具或数据生产流程建设
每周实习 4 天及以上,实习周期 4 个月及以上优先

工作职责

跟踪和调研 GUI Agent、Computer-Use Agent、Mobile Agent、Web Agent 等方向的前沿技术,重点关注环境合成、任务生成、自动评测、轨迹数据构建、RL/RLVR 训练等相关方法和开源项目

参与 GUI Agent 任务环境合成与可验证评测体系建设,包括移动端 / Web / 桌面任务环境设计、模拟应用构建、任务模板设计、状态建模、mock backend、任务完成判定、verifier / reward 信号设计等
参与 GUI Agent 数据与 RL 训练闭环建设,包括任务生成、轨迹采集、数据筛选、失败案例分析、困难样本挖掘、rollout 数据分析、训练环境接入和策略效果评估,持续提升模型任务完成率、泛化性和执行效率

优先资格

有 GUI Agent、多模态大模型、强化学习、自动化评测、Code Agent 工具使用、算法竞赛或高水平论文经历者优先

AI 洞察

优缺点分析

优点

  • 身处AI Agent最前沿领域,技术积累含金量高
  • 小米大厂平台,资源丰富,有机会参与高水平研究
  • 团队方向热门,未来职业发展空间大,易获得优秀Offer
  • 技术难度高,需要持续学习前沿论文和开源项目
  • 实习周期要求较长(4个月以上),需要投入大量时间
  • 竞争激烈,岗位对编程和工程能力要求严格
  • 适合对AI Agent和强化学习有强烈兴趣,具备扎实编程基础,希望积累前沿研究经验的高年级本科生或硕博研究生

缺点 / 挑战

暂无明显挑战项

角色解读

  • 从实习生成长为全职AI研究员或工程师,深入GUI Agent领域
  • 可向多模态大模型、强化学习或Agent系统架构方向发展
  • 积累顶会论文发表经验,成为行业专家或技术Leader
  • 跟踪GUI Agent、Computer-Use Agent等前沿技术,重点关注环境合成、任务生成和RL训练方法
  • 参与设计移动端、Web、桌面等任务环境,构建模拟应用、任务模板和状态建模
  • 负责数据与RL训练闭环建设,包括任务生成、轨迹采集、困难样本挖掘和策略效果评估
  • 扎实的编程能力,熟练使用Python或C++以及PyTorch等深度学习框架
  • 了解自动化工具如Playwright、Selenium、ADB、Docker等,能参与环境搭建
  • 具备独立阅读论文、复现方法并分析实验结果的能力
  • 对GUI Agent、多模态大模型、强化学习有浓厚兴趣和基础认知

申请策略

  • 在简历中展示对技术热情的细节,如个人博客、GitHub项目
  • 了解小米AI实验室的研究方向,面试中体现匹配度
  • 突出相关项目经验,如GUI Agent、自动化测试或强化学习项目
  • 强调编程能力,特别是Python、PyTorch以及使用过的自动化工具
  • 列举阅读过的前沿论文、复现的开源项目或参与过的算法竞赛
  • 提前学习Playwright、Selenium、ADB等工具,熟悉环境搭建
  • 温习强化学习基础(PPO、RLHF等),了解RLVR训练方法
  • 阅读GUI Agent相关论文(如AppAgent、CogAgent等)并尝试复现

面试指南

  • 对技术问题:先阐述概念,再结合实际项目经历说明具体实现和思考
  • 对场景设计题:提出框架性方案,分步骤说明输入、处理、输出和评估
  • 对开放性问题:展现学习能力,表达愿意深入研究和持续迭代的态度
  • 请简述你如何设计一个Web Agent的自动化任务环境?
  • 解释一下RL训练中reward信号如何设计,以GUI Agent为例
  • 你是否有使用Playwright或Selenium的经验?遇到过哪些挑战?
  • 如何评估GUI Agent的泛化性?你会设计哪些测试场景?
  • 熟悉至少一个自动化框架(如Playwright),并能编写Demo

匹配度报告

65
综合匹配度

大厂AI Agent前沿实习,技术成长极高,但薪资一般且需现场办公。

适合人群
最适合追求技术成长和前沿研究经历、对薪资要求不高的学生。
最强匹配
成长发展匹配
最弱匹配
薪资福利匹配
薪资福利40
成长发展95
工作生活50
使命价值75

薪资福利匹配

40较低

实习薪资一般,但小米福利较完善,但JD未提及具体薪酬福利。

薪资信号未披露(AI估算:4K-6K/月)

成长发展匹配

95较高

岗位属于AI前沿研究方向,技术成长空间极大,有大量学习机会。

技术前沿前沿/新兴技术
技术栈GUI Agent、Computer-Use Agent、多模态大模型、强化学习、环境合成、RL训练、Python、PyTorch、Playwright、Selenium、Docker
业务类型ambiguous

工作生活匹配

50较低

要求每周4天以上现场办公,实习周期长,灵活性较低。

工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值匹配

75中等

AI Agent行业高速增长,但社会影响力中性,岗位创新性较强。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

小米 的其他在招职位

  • 整合营销·数据策略实习生-2027届

    小米 · 北京市
    AI 估算 · 4k-6k
  • 商务合作主管实习生-2027届

    小米 · 北京市
    AI 估算 · 4k-6k
  • 机器人高级ID设计师

    小米 · 北京市
    AI 估算 · 25k-45k
  • 生态链软件产品经理实习生

    小米 · 武汉市
    AI 估算 · 3k-5k
  • 毫米波雷达高级算法工程师

    小米 · 北京市
    AI 估算 · 35k-55k

相似职位推荐

  • 技术策划-恋与深空

    叠纸游戏 · 上海市
    AI 估算 · 25k-45k
  • 数值策划(MMO)

    网易 · 广州市
    AI 估算 · 15k-25k
  • 安全技术研发工程师(实习)(J10472)

    中国通号 · 北京市
    AI 估算 · 4k-6k
  • 人工智能研发工程师(实习)(J10473)

    中国通号 · 北京市
    AI 估算 · 4k-6k
  • 2026校园招聘-发动机产品工程师

    卡特彼勒 · 天津市
    AI 估算 · 8k-12k

小米 的其他在招职位

  • 整合营销·数据策略实习生-2027届

    小米 · 北京市
    AI 估算 · 4k-6k
  • 商务合作主管实习生-2027届

    小米 · 北京市
    AI 估算 · 4k-6k
  • 机器人高级ID设计师

    小米 · 北京市
    AI 估算 · 25k-45k
  • 生态链软件产品经理实习生

    小米 · 武汉市
    AI 估算 · 3k-5k
  • 毫米波雷达高级算法工程师

    小米 · 北京市
    AI 估算 · 35k-55k

相似职位推荐

  • 技术策划-恋与深空

    叠纸游戏 · 上海市
    AI 估算 · 25k-45k
  • 数值策划(MMO)

    网易 · 广州市
    AI 估算 · 15k-25k
  • 安全技术研发工程师(实习)(J10472)

    中国通号 · 北京市
    AI 估算 · 4k-6k
  • 人工智能研发工程师(实习)(J10473)

    中国通号 · 北京市
    AI 估算 · 4k-6k
  • 2026校园招聘-发动机产品工程师

    卡特彼勒 · 天津市
    AI 估算 · 8k-12k