网易的Agent 算法研发工程师薪资是多少？

该职位薪资范围为 35k–60k（人民币/月）。

Agent 算法研发工程师的工作地点在哪里？

该职位工作地点位于北京市。工作形式为仅现场办公。

该职位要求硕士学历及高级经验工作经验。

🤖 AI 估测：¥35K-60K

发布时间：16 天前

这是一个专注于AI Agent算法研发的高级技术岗位

你将负责为网易有道系列教育产品（如词典、词典笔、学习规划等）设计和实现Agent的核心能力，包括任务规划、工具调用、记忆与检索增强等

同时，你需要进行SLM的预训练与微调、RAG链路中的辅助模型优化，以及构建全链路的数据工程与评测体系，推动算法在教育场景的工程化落地

面向有道词典、词典笔、学习规划/小P老师等产品线，负责 Agent 能力的整体方案与核心算法研发，包括任务分解、计划-执行/反思循环（Plan-Execute / ReAct / Reflection）、长短期记忆与工具路由等

负责 SLM（Small Language Model）持续预训练与指令微调（SFT），构建高效压缩与蒸馏方案，面向端侧/低延迟场景优化推理效率

设计与实现工具调用（Function/Tool Calling）体系：工具编目与路由、参数填充、结果验证与回退、调用链追踪与可观测性，提升工具使用的成功率与收益

基于强化学习（PPO/GRPO/DPO 类方法等）与奖励建模，面向语义理解、工具使用成功率、内容生成质量等目标进行对齐与优化，支持离线/在线策略迭代

负责 RAG 链路中的辅助模型研发与优化：统筹文档解析与检索排序能力

针对复杂排版内容（如学术论文、教辅、试卷）进行版面分析、OCR、表格/公式识别的模型微调

同时负责语义检索（Embedding）、重排（Rerank）及学习排序（LTR）模型的迭代，为 Agent 提供高质量的结构化数据与精准的上下文

负责大模型全链路的数据工程与处理：主导高质量数据的合成（Synthetic Data）、清洗、去重与治理

构建并优化用于 SFT、对齐及评测的数据集（如工具调用轨迹、复杂推理过程数据等）

设计策略采样、难例挖掘与失败案例回放的反馈闭环

建立系统化评测体系：离线基准（理解/工具成功率/可用性）、端到端任务评测、A/B 实验与线上指标监控，推进效果持续迭代

推动工程化落地与跨团队协作：负责训练管线并行、推理服务化与端侧加速

与产品、工程团队紧密配合，推进算法落地，持续提升用户体验与业务指标

硕士及以上学历，计算机、人工智能、机器学习等相关专业（优秀者可放宽至本科）

精通 Python，熟练使用 PyTorch 等深度学习框架，具备良好的代码风格与架构设计能力

具备 LLM/SLM 训练与微调经验，熟悉 SFT、对齐与强化学习相关方法（如 PPO/GRPO/DPO 等）的原理与实践

熟悉 Agent 体系与典型范式（Plan-Execute、ReAct、工具调用/函数调用、记忆与检索增强），能将算法设计与实际教育/学习场景有效结合

具备扎实的辅助模型（检索排序与多模态解析）实战经验：熟悉向量检索（BM25/Dense Retrieval）、重排（Cross-Encoder）及点击转化建模

熟悉 OCR 与版面分析（如 LayoutLM、Marker 等），能有效解决复杂长文本与多模态信息的提取难题

具备强大的数据处理与工程能力：精通大规模数据清洗与清洗规则编写，熟悉高质量数据合成方案，对数据质量敏感，能独立搭建数据飞轮与难例挖掘体系

具备良好的问题分解与实验设计能力，能在不完美数据与复杂约束下推进落地

主动负责，抗压能力强，善于沟通与协作

Agent 算法研发工程师

🤖 AI 估测：¥35K-60K

发布时间：16 天前