多点数智的AI工程师-Agent模型优化与评估方向（成都）薪资是多少？

该职位薪资范围为 4k–6k（人民币/月）。

AI工程师-Agent模型优化与评估方向（成都）的工作地点在哪里？

该职位工作地点位于成都市。工作形式为仅现场办公。

该职位要求本科学历及无经验要求工作经验。

🤖 AI 估测：¥4K-6K

发布时间：大约 18 小时前

该职位专注于AI Agent的模型优化与评估，你将参与构建自动化评测基准、开发基于LLM的评估管线，并进行模型后训练与微调

适合对LLM、Agent框架和模型对齐技术有浓厚兴趣的2026届毕业生

Agent 评价体系构建 (Evaluation)：

构建针对 Agent 业务场景的自动化评测基准 (Benchmark)

开发基于 LLM-as-a-Judge 的评估管线，量化 Agent 的指令遵循能力 (Instruction Following)、逻辑推理能力 (Reasoning) 和工具调用准确率 (Tool Use)

设计并维护“幻觉”检测机制，确保输出的安全性与真实性

模型后训练与调优 (Post-training)：

负责基座模型（Base Model）在特定 Agent 场景下的 SFT (Supervised Fine-Tuning) 工作，规范模型的输出格式（如 JSON）和对话风格

探索 DPO (Direct Preference Optimization) 或 PPO 等对齐算法，优化模型的决策倾向，使其更符合人类或业务的偏好

负责 LoRA/QLoRA 等参数高效微调 (PEFT) 实验，在显存受限情况下优化模型性能

数据合成与清洗：

利用 GPT-4 等强模型构造高质量的合成数据 (Synthetic Data) 用于蒸馏或微调

清洗和构建用于评测的 Golden Dataset (金标数据集)

2026届本科及以上学历，计算机、数学、统计学等相关专业，熟悉 Python，熟练使用 Linux 开发环境

精通 PyTorch，熟练使用 Hugging Face 全家桶 (Transformers, Datasets, PEFT, TRL)

有过 LLM 微调经验 (SFT/LoRA)，了解 DeepSpeed/FSDP 等分布式训练基础者优先

了解或使用过 RAGAS, G-Eval, MT-Bench, 或者 LangChain 的评估模块

加分项：操作过Agent 框架 (AutoGPT, MetaGPT, LangGraph)，理解 Agent 的 ReAct/CoT 思考过程

有数据合成 (Data Synthesis) 经验，如使用 Self-Instruct 方式生成数据

熟悉 DSPy (自动 Prompt 优化) 框架

AI工程师-Agent模型优化与评估方向（成都）

🤖 AI 估测：¥4K-6K

发布时间：大约 18 小时前