Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Dmall logo
多点数智
AI工程师-Agent模型优化与评估方向(成都)
立即应聘

AI工程师-Agent模型优化与评估方向(成都)

发布于 大约 2 个月前

实习/见习

成都市
无经验要求
实习生
仅现场办公
本科
软件工程
PyTorch
LLM
SFT
DPO
LoRA
Ragas

AI 估算 · 4k–6k

实习岗位,成都地区AI方向实习生薪资水平,结合公司规模和技能要求。

职位详情

关于这个职位

该职位专注于AI Agent的模型优化与评估,你将参与构建自动化评测基准、开发基于LLM的评估管线,并进行模型后训练与微调

适合对LLM、Agent框架和模型对齐技术有浓厚兴趣的2026届毕业生

最低要求

届本科及以上学历,计算机、数学、统计学等相关专业,熟悉 Python,熟练使用 Linux 开发环境

精通 PyTorch,熟练使用 Hugging Face 全家桶 (Transformers, Datasets, PEFT, TRL)
有过 LLM 微调经验 (SFT/LoRA),了解 DeepSpeed/FSDP 等分布式训练基础者优先
了解或使用过 RAGAS, G-Eval, MT-Bench, 或者 LangChain 的评估模块

工作职责

Agent 评价体系构建 (Evaluation):

构建针对 Agent 业务场景的自动化评测基准 (Benchmark)
开发基于 LLM-as-a-Judge 的评估管线,量化 Agent 的指令遵循能力 (Instruction Following)、逻辑推理能力 (Reasoning) 和工具调用准确率 (Tool Use)
设计并维护“幻觉”检测机制,确保输出的安全性与真实性
模型后训练与调优 (Post-training):
负责基座模型(Base Model)在特定 Agent 场景下的 SFT (Supervised Fine-Tuning) 工作,规范模型的输出格式(如 JSON)和对话风格
探索 DPO (Direct Preference Optimization) 或 PPO 等对齐算法,优化模型的决策倾向,使其更符合人类或业务的偏好
负责 LoRA/QLoRA 等参数高效微调 (PEFT) 实验,在显存受限情况下优化模型性能
数据合成与清洗:
利用 GPT-4 等强模型构造高质量的合成数据 (Synthetic Data) 用于蒸馏或微调
清洗和构建用于评测的 Golden Dataset (金标数据集)

优先资格

加分项:操作过Agent 框架 (AutoGPT, MetaGPT, LangGraph),理解 Agent 的 ReAct/CoT 思考过程

有数据合成 (Data Synthesis) 经验,如使用 Self-Instruct 方式生成数据
熟悉 DSPy (自动 Prompt 优化) 框架

AI 洞察

优缺点分析

优点

  • 接触前沿的LLM和Agent技术,积累模型微调与评估的实战经验
  • 公司为知名零售科技企业,平台资源丰富,数据场景真实
  • 团队技术氛围浓厚,有机会参与论文或开源项目
  • 模型训练和评估可能涉及大量实验,需要耐心和细致
  • 竞争激烈,需要扎实的编程和机器学习基础
  • 适合对LLM和Agent技术有强烈兴趣,具备一定深度学习基础,渴望在AI领域快速成长的2026届毕业生

缺点 / 挑战

  • 实习岗位,工作内容技术难度较高,需要快速学习大量新知识

角色解读

  • 从实习生成长为AI工程师,深入掌握LLM微调与对齐技术
  • 向Agent系统架构师方向发展,主导复杂Agent系统的设计与优化
  • 未来可转向AI研究岗位,参与前沿模型训练与算法创新
  • 构建Agent自动化评测基准,开发基于LLM-as-a-Judge的评估管线,量化模型能力
  • 负责基座模型的SFT微调,探索DPO/PPO等对齐算法,优化模型决策倾向
  • 利用GPT-4等强模型构造合成数据,清洗并构建金标数据集
  • 精通Python和PyTorch,熟练使用Hugging Face全家桶
  • 有LLM微调经验(SFT/LoRA),了解分布式训练基础
  • 了解Agent框架(如AutoGPT、LangGraph)和评估工具(RAGAS、MT-Bench)

申请策略

  • 关注多点数智在零售AI领域的布局,面试中展现对业务场景的理解
  • 准备一个完整的LLM微调或Agent项目案例,展示技术深度
  • 突出LLM微调项目经验,包括SFT、LoRA等具体技术细节
  • 展示对Agent框架(如AutoGPT、LangGraph)的理解或使用经历
  • 强调Python、PyTorch和Hugging Face工具链的熟练程度
  • 提前学习DPO/PPO等对齐算法,了解RLHF基本原理
  • 熟悉RAGAS、G-Eval等评估工具,尝试构建简单的评测管线
  • 动手实践数据合成方法,如Self-Instruct

面试指南

  • 对于技术问题,先阐述核心概念,再结合项目经验具体说明
  • 对于设计类问题,采用“目标-方案-评估”的结构,展示系统性思维
  • 对于开放性问题,先给出自己的理解,再补充可能的改进方向
  • 请描述一次你使用SFT或LoRA微调LLM的经历,遇到了哪些挑战?
  • 如何设计一个Agent的自动化评测基准?你会考虑哪些指标?
  • 解释DPO和PPO的区别,以及它们在模型对齐中的作用
  • 你如何利用GPT-4生成高质量的合成数据?有哪些注意事项?
  • 你对ReAct和CoT的理解是什么?在Agent中如何应用?

匹配度报告

60
综合匹配度

前沿AI Agent实习,技术成长空间大,但薪资和福利一般。

适合人群
适合追求技术成长、对AI前沿技术有热情,对薪资和WLB要求不高的求职者。
最强匹配
成长发展匹配
最弱匹配
薪资福利匹配
薪资福利40
成长发展90
工作生活50
使命价值60

薪资福利匹配

40较低

实习薪资处于市场中等水平,但福利未明确提及,补偿性动机满足程度一般。

薪资信号未披露(AI估算:4K-6K/月)

成长发展匹配

90较高

职位涉及前沿的LLM和Agent技术,提供丰富的技能成长机会,发展性动机满足程度高。

技术前沿前沿/新兴技术
技术栈Python、PyTorch、Hugging Face、LLM、SFT、LoRA、DPO、PPO、Agent、LangChain、RAGAS、GPT-4、Self-Instruct、DSPy
业务类型ambiguous

工作生活匹配

50较低

工作模式为仅现场办公,未提及弹性或WLB信息,生活化动机满足程度一般。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值匹配

60中等

AI Agent领域属于高速增长赛道,但社会影响力有限,意义感动机满足程度中等。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

多点数智 的其他在招职位

  • 海外实施顾问(英语工作)

    多点数智 · 深圳市
    AI 估算 · 20k-30k
  • 高级售前顾问(英文&粤语流利)

    多点数智 · 深圳市
    AI 估算 · 20k-35k
  • 核算专家

    多点数智 · 北京市
    AI 估算 · 25k-45k
  • 产品经理

    多点数智 · 北京市
    AI 估算 · 15k-25k
  • IT Support

    多点数智 · 帕赛市
    AI 估算 · 15k-25k

相似职位推荐

  • AI全栈工程师(AI Coding 方向)

    小红书 · 北京市
    AI 估算 · 45k-70k
  • 智能体-全栈开发专家-CodeBuddy/WorkBuddy

    腾讯 · 深圳市
    AI 估算 · 40k-70k
  • 智能体-全栈开发专家-CodeBuddy/WorkBuddy

    腾讯 · 深圳市
    AI 估算 · 30k-60k
  • 高级/资深iOS开发工程师(MJ035494)

    携程 · 上海市
    AI 估算 · 25k-45k
  • Staff Machine Learning Engineer, ML Infrastructure - Offline

    Unity Technologies · 上海市
    AI 估算 · 40k-70k

多点数智 的其他在招职位

  • 海外实施顾问(英语工作)

    多点数智 · 深圳市
    AI 估算 · 20k-30k
  • 高级售前顾问(英文&粤语流利)

    多点数智 · 深圳市
    AI 估算 · 20k-35k
  • 核算专家

    多点数智 · 北京市
    AI 估算 · 25k-45k
  • 产品经理

    多点数智 · 北京市
    AI 估算 · 15k-25k
  • IT Support

    多点数智 · 帕赛市
    AI 估算 · 15k-25k

相似职位推荐

  • AI全栈工程师(AI Coding 方向)

    小红书 · 北京市
    AI 估算 · 45k-70k
  • 智能体-全栈开发专家-CodeBuddy/WorkBuddy

    腾讯 · 深圳市
    AI 估算 · 40k-70k
  • 智能体-全栈开发专家-CodeBuddy/WorkBuddy

    腾讯 · 深圳市
    AI 估算 · 30k-60k
  • 高级/资深iOS开发工程师(MJ035494)

    携程 · 上海市
    AI 估算 · 25k-45k
  • Staff Machine Learning Engineer, ML Infrastructure - Offline

    Unity Technologies · 上海市
    AI 估算 · 40k-70k