网易的Agent模型算法实习生薪资是多少？

该职位薪资范围为 8k–15k（人民币/月）。

Agent模型算法实习生的工作地点在哪里？

该职位工作地点位于北京市。工作形式为仅现场办公。

网易的Agent模型算法实习生有什么任职要求？

该职位要求硕士学历及初级经验工作经验。

网易

Agent模型算法实习生

立即应聘

Agent模型算法实习生

发布于 4 个月前

实习/见习

北京市

初级经验

实习生

仅现场办公

硕士

研究与开发 (研发)

分布式训练

强化学习

数据工程

检索排序

Llm/Slm

PyTorch

AI 估算 · 8k–15k

实习岗位，但涉及前沿AI技术栈，技能要求高，且位于北京，薪资在实习生中具备竞争力。

职位详情

关于这个职位

这是一个专注于Agent模型算法研发的实习岗位

你将负责为有道词典等产品线开发Agent的核心能力，包括任务规划、工具调用和模型优化

工作内容涉及SLM训练、强化学习对齐、检索排序模型以及数据工程和评测体系的构建，旨在将前沿AI算法落地到实际产品中

最低要求

硕士及以上学历，计算机、人工智能、机器学习等相关专业（优秀者可放宽至本科）

精通 Python，熟练使用 PyTorch 等深度学习框架，具备良好的代码风格与工程习惯

具备 LLM/SLM 训练与微调经验，熟悉 SFT、对齐与强化学习相关方法（如 PPO/GRPO/DPO 等）的原理与实践

熟悉 Agent 体系与典型范式（Plan-Execute、ReAct、工具调用/函数调用、记忆与检索增强），能将算法设计与产品场景有效结合

具备检索与排序建模经验：熟悉 BM25/向量检索、重排（Cross-Encoder/Bi-Encoder）、学习排序与点击/转化建模，以及离线/在线评估方法

具备扎实的数据工程能力：数据清洗与治理、标注与弱监督、样本采样策略、难例挖掘与反馈闭环

具备良好的问题分解与实验设计能力，能在不完美数据与复杂约束下推进落地

主动负责，抗压能力强，善于沟通与协作

工作职责

面向有道词典、词典笔、学习规划/小P老师等产品线，负责 Agent 能力的整体方案与核心算法研发，包括任务分解、计划-执行/反思循环（Plan-Execute / ReAct / Reflection）、长短期记忆与工具路由等

负责 SLM（Small Language Model）持续预训练与指令微调（SFT），构建高效压缩与蒸馏方案，面向端侧/低延迟场景优化推理效率

设计与实现工具调用（Function/Tool Calling）体系：工具编目与路由、参数填充、结果验证与回退、调用链追踪与可观测性，提升工具使用的成功率与收益

基于强化学习（PPO/GRPO/DPO 类方法等）与奖励建模，面向语义理解、工具使用成功率、内容生成质量等目标进行对齐与优化，支持离线/在线策略迭代

负责搜索与排序相关模型：语义检索embedding/rerank、学习排序（pointwise/pairwise/listwise）、点击/转化信号建模与评估

负责数据全链路：高质量数据构建、策略采样、合成与清洗、去重与去噪、难例挖掘、失败案例回放及工具轨迹数据集构建

建立系统化评测体系：离线基准（理解/工具成功率/可用性）、端到端任务评测、A/B 实验与线上指标监控，推进效果持续迭代

推动工程化落地：训练管线与分布式并行、推理服务化与弹性扩缩、缓存与检索加速、成本/时延/稳定性优化

跨团队协作，与产品、工程、数据及标注团队紧密配合，按期高质量交付，持续提升用户体验与业务指标

AI 洞察

优缺点分析

优点

技术前沿：直接接触并实践Agent、SLM、强化学习对齐等AI领域最热门的技术，技能积累价值高
平台优秀：在网易这样的互联网巨头实习，能接触大规模真实业务场景，项目经验和履历背书力强
业务落地：工作直接服务于有道词典等成熟产品，能亲眼看到自己的代码影响千万用户，成就感强
综合锻炼：涉及算法、数据、工程、评测全链路，能快速建立对AI项目研发的完整认知
工作强度可能较大：JD中提到“抗压能力强”，且互联网大厂实习通常节奏快、交付要求高
竞争激烈：此类顶尖公司的AI实习岗位申请者众多，对候选人的背景和实力要求极高
适合对AI前沿技术有强烈热情、具备扎实算法和工程基础、并希望在大平台快速成长的硕士或优秀本科生

缺点 / 挑战

技术门槛高：要求同时掌握多个前沿AI子领域（Agent、LLM、RL）的知识与实践，学习压力大

角色解读

技术路径：可深耕Agent方向，成为AI算法专家，或向大模型架构师、AI系统工程师发展
业务路径：积累产品落地经验后，可转向AI产品经理，负责技术驱动的产品规划与创新
行业前景：在AI+教育赛道积累的经验，为进入更广阔的AI应用领域（如智能助手、自动驾驶）奠定基础
研发面向教育产品的AI Agent核心算法，包括任务规划、工具调用和记忆管理，将前沿研究落地到实际应用
负责小型语言模型（SLM）的预训练、微调与优化，并构建高效的推理方案以适应端侧部署需求
构建并优化检索与排序模型，提升语义搜索和内容推荐的准确性与效率
负责数据全流程工作，从高质量数据集的构建、清洗到难例挖掘，并建立系统化的模型评测体系
精通Python和PyTorch，具备扎实的深度学习工程实践能力
熟悉LLM/SLM的训练、微调（SFT）及强化学习对齐（如PPO/DPO）等前沿技术
掌握Agent系统（如ReAct、工具调用）和检索排序（向量检索、学习排序）的核心原理与实践
具备优秀的数据处理、实验设计和跨团队沟通协作能力

申请策略

提前了解网易有道业务线（如词典、硬件、教育服务），思考AI技术如何为其赋能
在面试中展现出对技术细节的深入理解和对业务落地的强烈兴趣
重点突出与LLM训练微调、强化学习或Agent相关的课程项目、科研课题或竞赛经历
详细描述使用Python和PyTorch解决实际问题的项目，展示代码能力和工程思维
如果有数据处理、模型评测或跨团队协作的经验，务必量化成果并清晰阐述
强调快速学习能力、抗压能力以及将复杂问题分解落地的实例
深入理解ReAct、Tool Calling等Agent范式的论文和开源实现，并尝试复现或改进
动手实践一个完整的SFT或RLHF（如使用TRL库）项目，熟悉整个流程和常见坑点

面试指南

对于技术问题，采用“背景-任务-行动-结果”（STAR）原则来组织答案，确保逻辑清晰
结合具体案例，不仅要说明“做了什么”，更要解释“为什么这么做”以及“权衡了什么”
对于开放性问题，可以先定义问题和边界，再提出系统化的解决方案，并讨论其优缺点
请详细介绍一个你参与的LLM微调或强化学习对齐项目，遇到了什么挑战，如何解决的？
你是如何理解Agent中的“计划-执行-反思”循环的？能否举例说明其在一个具体任务中的应用？
如果让你设计一个工具调用（Tool Calling）系统，你会考虑哪些关键模块和可能的风险？
如何评估一个检索模型的好坏？除了准确率，还会关注哪些离线或在线指标？
描述一次你处理“脏数据”或进行“难例挖掘”的经历，你的方法和最终效果如何？

职位点评

综合评分

顶尖大厂AI实习，技术前沿成长快，薪资符合预期，但需面对一定工作强度。

从学习成长、工作节奏、岗位方向和实习待遇综合评估，方便比较实习机会。

更适合这类人

最适合那些将技能成长和职业发展放在首位，不惧挑战，并看好AI技术社会价值的求职者。

表现最好

成长发展

相对薄弱

工作生活

薪资福利70

成长发展95

工作生活50

使命价值80

薪资福利

70中等

作为实习岗位，薪资在市场中具备一定竞争力，且大平台履历对未来求职有长期价值，但实习期福利通常有限。

薪资信号市场水准 (8K-15K/月)

成长发展

95较高

岗位技术栈极其前沿，涉及AI领域多个核心方向，且在大厂业务中实战，对技能成长和职业起点助力巨大。

技术前沿前沿/新兴技术

技术栈Python、PyTorch、LLM、SLM、SFT、PPO、GRPO、DPO、Agent、ReAct、Tool Calling、BM25、embedding、rerank

业务类型profit_center

工作生活

50较低

工作地点明确为北京，模式为现场办公，且JD要求“抗压能力强”，暗示工作节奏可能较快，对WLB的满足度一般。

工作模式仅现场办公

办公地点未明确

加班情况JD含高强度暗示词

使命价值

80较高

工作直接服务于教育产品，通过AI技术提升学习体验，具备积极的社会意义；且处于AI这一高速增长的核心赛道。

行业发展高速增长赛道

社会影响正向社会影响力较高

创新程度积极采用新技术

网易的其他在招职位

相似职位推荐

Watch Jobs

Agent模型算法实习生

职位详情

关于这个职位

最低要求

工作职责

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

招聘HR-云音乐

海外产品运营（社区AI工具方向）

IT-实习生（广州）

游戏主美（新二次元项目）

资深动画设计师（二次元）

研发光刻工艺专家(J14238)

介质算法工程师(J13509)

薄膜研发工艺工程师(J13631)

OPC研发工程师(J12668)

薄膜工艺研发工程师/专家(J14452)

网易的其他在招职位

招聘HR-云音乐

海外产品运营（社区AI工具方向）

IT-实习生（广州）

游戏主美（新二次元项目）

资深动画设计师（二次元）

相似职位推荐

研发光刻工艺专家(J14238)

介质算法工程师(J13509)

薄膜研发工艺工程师(J13631)

OPC研发工程师(J12668)

薄膜工艺研发工程师/专家(J14452)

Agent模型算法实习生

职位详情

关于这个职位

最低要求

工作职责

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

网易 的其他在招职位

招聘HR-云音乐

海外产品运营（社区AI工具方向）

IT-实习生（广州）

游戏主美（新二次元项目）

资深动画设计师（二次元）

相似职位推荐

研发光刻工艺专家(J14238)

介质算法工程师(J13509)

薄膜研发工艺工程师(J13631)

OPC研发工程师(J12668)

薄膜工艺研发工程师/专家(J14452)

网易的其他在招职位