Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/多点数智/AI工程师-Agent模型优化与评估方向(北京)
Dmall logo
D
多点数智 (Dmall)

职位信息

北京市
无经验要求
全职员工
仅现场办公
本科
普通员工/个人贡献者

标签

PyTorchLLMSFTDPOLoRARagas
💡

核心评价

前沿AI Agent技术岗,技能成长空间极大,但薪资福利未明确,WLB一般。

AI工程师-Agent模型优化与评估方向(北京)

🤖 AI 估测:¥15K-25K

发布时间:大约 18 小时前

立即应聘

ℹ️关于这个职位

该职位专注于AI Agent模型的优化与评估,你将参与构建自动化评测基准、开发基于LLM的评估管线,并进行模型后训练与调优
适合对LLM、Agent框架和模型微调有浓厚兴趣的应届生,能够深入接触前沿技术并积累实战经验

✓工作职责

Agent 评价体系构建 (Evaluation):构建针对 Agent 业务场景的自动化评测基准 (Benchmark)
开发基于 LLM-as-a-Judge 的评估管线,量化 Agent 的指令遵循能力 (Instruction Following)、逻辑推理能力 (Reasoning) 和工具调用准确率 (Tool Use)
设计并维护“幻觉”检测机制,确保输出的安全性与真实性
模型后训练与调优 (Post-training):负责基座模型(Base Model)在特定 Agent 场景下的 SFT (Supervised Fine-Tuning) 工作,规范模型的输出格式(如 JSON)和对话风格
探索 DPO (Direct Preference Optimization) 或 PPO 等对齐算法,优化模型的决策倾向,使其更符合人类或业务的偏好
负责 LoRA/QLoRA 等参数高效微调 (PEFT) 实验,在显存受限情况下优化模型性能
数据合成与清洗:利用 GPT-4 等强模型构造高质量的合成数据 (Synthetic Data) 用于蒸馏或微调
清洗和构建用于评测的 Golden Dataset (金标数据集)

⭐最低要求

2026届本科及以上学历,计算机、数学、统计学等相关专业,熟悉 Python,熟练使用 Linux 开发环境
精通 PyTorch,熟练使用 Hugging Face 全家桶 (Transformers, Datasets, PEFT, TRL)
有过 LLM 微调经验 (SFT/LoRA),了解 DeepSpeed/FSDP 等分布式训练基础者优先
了解或使用过 RAGAS, G-Eval, MT-Bench, 或者 LangChain 的评估模块

👍优先资格

加分项:操作过Agent 框架 (AutoGPT, MetaGPT, LangGraph),理解 Agent 的 ReAct/CoT 思考过程
有数据合成 (Data Synthesis) 经验,如使用 Self-Instruct 方式生成数据
熟悉 DSPy (自动 Prompt 优化) 框架
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

多点数智 的其他在招职位

  • 产品经理

    多点数智

    北京市 · 仅现场办公

  • IT Support

    多点数智

    帕赛市 · 混合式弹性办公

  • 销售

    多点数智

    北京市 · 仅现场办公

  • 客户经理

    多点数智

    北京市 · 仅现场办公

  • 算法工程师(武汉)

    多点数智

    武汉市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公