Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业定价
我的收藏免费试用登录注册

Netease logo
网易
Agent模型算法实习生
立即应聘

Agent模型算法实习生

发布于 2 个月前

实习/见习

北京市
初级经验
实习生
仅现场办公
硕士
研究与开发 (研发)
数据工程
PyTorch
强化学习
分布式训练
检索排序
Llm/Slm

AI 估算 · 8k–15k

实习岗位,但涉及前沿AI技术栈,技能要求高,且位于北京,薪资在实习生中具备竞争力。

职位详情

关于这个职位

这是一个专注于Agent模型算法研发的实习岗位

你将负责为有道词典等产品线开发Agent的核心能力,包括任务规划、工具调用和模型优化
工作内容涉及SLM训练、强化学习对齐、检索排序模型以及数据工程和评测体系的构建,旨在将前沿AI算法落地到实际产品中

最低要求

硕士及以上学历,计算机、人工智能、机器学习等相关专业(优秀者可放宽至本科)

精通 Python,熟练使用 PyTorch 等深度学习框架,具备良好的代码风格与工程习惯
具备 LLM/SLM 训练与微调经验,熟悉 SFT、对齐与强化学习相关方法(如 PPO/GRPO/DPO 等)的原理与实践
熟悉 Agent 体系与典型范式(Plan-Execute、ReAct、工具调用/函数调用、记忆与检索增强),能将算法设计与产品场景有效结合
具备检索与排序建模经验:熟悉 BM25/向量检索、重排(Cross-Encoder/Bi-Encoder)、学习排序与点击/转化建模,以及离线/在线评估方法
具备扎实的数据工程能力:数据清洗与治理、标注与弱监督、样本采样策略、难例挖掘与反馈闭环
具备良好的问题分解与实验设计能力,能在不完美数据与复杂约束下推进落地
主动负责,抗压能力强,善于沟通与协作

工作职责

面向有道词典、词典笔、学习规划/小P老师等产品线,负责 Agent 能力的整体方案与核心算法研发,包括任务分解、计划-执行/反思循环(Plan-Execute / ReAct / Reflection)、长短期记忆与工具路由等

负责 SLM(Small Language Model)持续预训练与指令微调(SFT),构建高效压缩与蒸馏方案,面向端侧/低延迟场景优化推理效率
设计与实现工具调用(Function/Tool Calling)体系:工具编目与路由、参数填充、结果验证与回退、调用链追踪与可观测性,提升工具使用的成功率与收益
基于强化学习(PPO/GRPO/DPO 类方法等)与奖励建模,面向语义理解、工具使用成功率、内容生成质量等目标进行对齐与优化,支持离线/在线策略迭代
负责搜索与排序相关模型:语义检索embedding/rerank、学习排序(pointwise/pairwise/listwise)、点击/转化信号建模与评估
负责数据全链路:高质量数据构建、策略采样、合成与清洗、去重与去噪、难例挖掘、失败案例回放及工具轨迹数据集构建
建立系统化评测体系:离线基准(理解/工具成功率/可用性)、端到端任务评测、A/B 实验与线上指标监控,推进效果持续迭代
推动工程化落地:训练管线与分布式并行、推理服务化与弹性扩缩、缓存与检索加速、成本/时延/稳定性优化
跨团队协作,与产品、工程、数据及标注团队紧密配合,按期高质量交付,持续提升用户体验与业务指标

AI 洞察

优缺点分析

优点

  • 技术前沿:直接接触并实践Agent、SLM、强化学习对齐等AI领域最热门的技术,技能积累价值高
  • 平台优秀:在网易这样的互联网巨头实习,能接触大规模真实业务场景,项目经验和履历背书力强
  • 业务落地:工作直接服务于有道词典等成熟产品,能亲眼看到自己的代码影响千万用户,成就感强
  • 综合锻炼:涉及算法、数据、工程、评测全链路,能快速建立对AI项目研发的完整认知
  • 工作强度可能较大:JD中提到“抗压能力强”,且互联网大厂实习通常节奏快、交付要求高
  • 竞争激烈:此类顶尖公司的AI实习岗位申请者众多,对候选人的背景和实力要求极高
  • 适合对AI前沿技术有强烈热情、具备扎实算法和工程基础、并希望在大平台快速成长的硕士或优秀本科生

缺点 / 挑战

  • 技术门槛高:要求同时掌握多个前沿AI子领域(Agent、LLM、RL)的知识与实践,学习压力大

角色解读

  • 技术路径:可深耕Agent方向,成为AI算法专家,或向大模型架构师、AI系统工程师发展
  • 业务路径:积累产品落地经验后,可转向AI产品经理,负责技术驱动的产品规划与创新
  • 行业前景:在AI+教育赛道积累的经验,为进入更广阔的AI应用领域(如智能助手、自动驾驶)奠定基础
  • 研发面向教育产品的AI Agent核心算法,包括任务规划、工具调用和记忆管理,将前沿研究落地到实际应用
  • 负责小型语言模型(SLM)的预训练、微调与优化,并构建高效的推理方案以适应端侧部署需求
  • 构建并优化检索与排序模型,提升语义搜索和内容推荐的准确性与效率
  • 负责数据全流程工作,从高质量数据集的构建、清洗到难例挖掘,并建立系统化的模型评测体系
  • 精通Python和PyTorch,具备扎实的深度学习工程实践能力
  • 熟悉LLM/SLM的训练、微调(SFT)及强化学习对齐(如PPO/DPO)等前沿技术
  • 掌握Agent系统(如ReAct、工具调用)和检索排序(向量检索、学习排序)的核心原理与实践
  • 具备优秀的数据处理、实验设计和跨团队沟通协作能力

申请策略

  • 提前了解网易有道业务线(如词典、硬件、教育服务),思考AI技术如何为其赋能
  • 在面试中展现出对技术细节的深入理解和对业务落地的强烈兴趣
  • 重点突出与LLM训练微调、强化学习或Agent相关的课程项目、科研课题或竞赛经历
  • 详细描述使用Python和PyTorch解决实际问题的项目,展示代码能力和工程思维
  • 如果有数据处理、模型评测或跨团队协作的经验,务必量化成果并清晰阐述
  • 强调快速学习能力、抗压能力以及将复杂问题分解落地的实例
  • 深入理解ReAct、Tool Calling等Agent范式的论文和开源实现,并尝试复现或改进
  • 动手实践一个完整的SFT或RLHF(如使用TRL库)项目,熟悉整个流程和常见坑点

面试指南

  • 对于技术问题,采用“背景-任务-行动-结果”(STAR)原则来组织答案,确保逻辑清晰
  • 结合具体案例,不仅要说明“做了什么”,更要解释“为什么这么做”以及“权衡了什么”
  • 对于开放性问题,可以先定义问题和边界,再提出系统化的解决方案,并讨论其优缺点
  • 请详细介绍一个你参与的LLM微调或强化学习对齐项目,遇到了什么挑战,如何解决的?
  • 你是如何理解Agent中的“计划-执行-反思”循环的?能否举例说明其在一个具体任务中的应用?
  • 如果让你设计一个工具调用(Tool Calling)系统,你会考虑哪些关键模块和可能的风险?
  • 如何评估一个检索模型的好坏?除了准确率,还会关注哪些离线或在线指标?
  • 描述一次你处理“脏数据”或进行“难例挖掘”的经历,你的方法和最终效果如何?

匹配度报告

74
综合匹配度

顶尖大厂AI实习,技术前沿成长快,薪资符合预期,但需面对一定工作强度。

适合人群
最适合那些将技能成长和职业发展放在首位,不惧挑战,并看好AI技术社会价值的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利70
成长发展95
工作生活50
使命价值80

薪资福利匹配

70中等

作为实习岗位,薪资在市场中具备一定竞争力,且大平台履历对未来求职有长期价值,但实习期福利通常有限。

薪资信号市场水准 (8K-15K/月)

成长发展匹配

95较高

岗位技术栈极其前沿,涉及AI领域多个核心方向,且在大厂业务中实战,对技能成长和职业起点助力巨大。

技术前沿前沿/新兴技术
技术栈Python、PyTorch、LLM、SLM、SFT、PPO、GRPO、DPO、Agent、ReAct、Tool Calling、BM25、embedding、rerank
业务类型profit_center

工作生活匹配

50较低

工作地点明确为北京,模式为现场办公,且JD要求“抗压能力强”,暗示工作节奏可能较快,对WLB的满足度一般。

工作模式仅现场办公
办公地点未明确
加班情况JD含高强度暗示词

使命价值匹配

80较高

工作直接服务于教育产品,通过AI技术提升学习体验,具备积极的社会意义;且处于AI这一高速增长的核心赛道。

行业发展高速增长赛道
社会影响正向社会影响力较高
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

网易 的其他在招职位

  • 机器人高级开发工程师(CMDB&OTA方向)

    网易 · 杭州市
    AI 估算 · 25k-40k
  • 游戏AI Agent开发实习生(七日世界)

    网易 · 上海市
    AI 估算 · 4k-6k
  • 高级安全运营专员(智能服务方向)

    网易 · 成都市
    AI 估算 · 15k-25k
  • 客服主管/经理

    网易 · 成都市
    AI 估算 · 15k-25k
  • 高级AI创意视觉设计师

    网易 · 杭州市
    AI 估算 · 20k-35k

相似职位推荐

  • 自动驾驶测试实习生-2027届

    小米 · 武汉市
    AI 估算 · 4k-6k
  • Intern- Application Specialist

    沃特世 · 上海市
    AI 估算 · 4k-6k
  • 游戏模型数据专家-研发数据

    腾讯 · 深圳市
    AI 估算 · 30k-50k
  • 游戏模型评测专家

    腾讯 · 深圳市
    AI 估算 · 30k-50k
  • 模型数据算法专家/负责人-数据方向

    腾讯 · 深圳市
    AI 估算 · 40k-80k

网易 的其他在招职位

  • 机器人高级开发工程师(CMDB&OTA方向)

    网易 · 杭州市
    AI 估算 · 25k-40k
  • 游戏AI Agent开发实习生(七日世界)

    网易 · 上海市
    AI 估算 · 4k-6k
  • 高级安全运营专员(智能服务方向)

    网易 · 成都市
    AI 估算 · 15k-25k
  • 客服主管/经理

    网易 · 成都市
    AI 估算 · 15k-25k
  • 高级AI创意视觉设计师

    网易 · 杭州市
    AI 估算 · 20k-35k

相似职位推荐

  • 自动驾驶测试实习生-2027届

    小米 · 武汉市
    AI 估算 · 4k-6k
  • Intern- Application Specialist

    沃特世 · 上海市
    AI 估算 · 4k-6k
  • 游戏模型数据专家-研发数据

    腾讯 · 深圳市
    AI 估算 · 30k-50k
  • 游戏模型评测专家

    腾讯 · 深圳市
    AI 估算 · 30k-50k
  • 模型数据算法专家/负责人-数据方向

    腾讯 · 深圳市
    AI 估算 · 40k-80k