Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

PINGAN logo
中国平安
AI测试开发专家
立即应聘

AI测试开发专家

发布于 大约 15 小时前

普通员工/个人贡献者

深圳市
专家级经验
全职员工
仅现场办公
本科
软件工程
模型评估
自动化测试
多模态
提示词工程
AI Agent
大模型评测
平安好医生

AI 估算 · 25k–45k

深圳AI测试专家岗,平安大厂稳定,技能要求高(AI Agent、大模型),市场竞争力强,薪资面议但预计中高位。

职位详情

关于这个职位

该职位负责平安好医生AI智能体应用(如平安芯医、安主任)的质量保障,构建端到端评测体系,并利用大模型驱动自动化测试平台

需要深入理解LangChain框架和AI Agent技术栈,设计多维度评测方案,同时参与全流程质量保障和跨团队协作
适合具备5年以上测试经验、聚焦AI应用测试的高级专家

最低要求

一、专业背景

本科及以上学历,计算机、软件工程等相关专业
具备5年以上软件测试经验,其中至少2-3年聚焦于AI类应用(如对话机器人、Agent等)的测试或评测工作
二、AI智能体评测能力
深入理解AI Agent相关技术栈,熟悉LangChain/LangSmith等框架原理,具备Agent流程设计、评估系统构建、工具开发等工程实践经验
具备构建端到端Agent评测体系的能力,能从多维度、多指标全面评估Agent行为质量,为后续优化提供数据支持和决策依据
扎实的提示词工程(Prompt Engineering)能力,能设计高质量评测提示词以验证模型行为的稳定性和安全性
三、算法与大模型评测能力
理解机器学习基础原理,熟悉常见模型评估指标(准确率、召回率、F1、BLEU、ROUGE等),具备模型效果评测与模型版本验证的工程化经验
对大模型原理(预训练、精调SFT、RAG等)有深入理解,精通大模型评测方法论,有评测基准数据集的接入与使用经验

工作职责

一、AI智能体(Agent)专项评测体系构建

负责平安好医生AI智能体应用(如平安芯医、安主任等)的端到端质量保障,基于LangChain框架设计Agent评测方案,覆盖任务规划、工具调用、记忆管理、多轮对话上下文连贯性等核心维度
二、AI驱动的自动化效能平台研发
深入探索并落地大模型(LLM)与AI Agent在接口测试、Web自动化、移动端自动化领域的创新应用,将测试领域的经验与核心知识封装为Skill能力,打造端到端智能自动化解决方案,显著提升研发质量和交付效率
三、大模型与算法评测体系建设
深入理解平安好医生自研“平安医博通”多模态大模型,制定面向医疗垂直领域的多维度评测方案,涵盖功能性、语义理解准确性、鲁棒性及模型安全等维度
四、全流程质量保障
参与AI产品核心需求的架构评审,承担关键链路的功能、接口、高可用及稳定性测试,设计端到端全链路质量解决方案
五、跨团队协作与质量文化
深度协同产品、研发、算法及医学专家团队,推进质量前置,参与需求与技术方案评审,从测试角度规避潜在风险

AI 洞察

优缺点分析

优点

  • 深度参与AI Agent前沿技术实践,积累LangChain、大模型评测等稀缺技能
  • 平安大厂平台稳定,医疗AI赛道前景广阔,社会价值高
  • 有机会构建自动化效能平台,技术成就感强
  • AI Agent评测标准尚不成熟,需要较强的创新和探索能力
  • 跨团队协作频繁,需与多方沟通,对综合能力要求高
  • 适合具备丰富测试经验、对AI技术有浓厚兴趣、愿意在医疗AI质量领域深耕的技术专家

缺点 / 挑战

  • 医疗领域对准确性和安全性要求极高,质量保障压力大

角色解读

  • 向AI质量架构师方向发展,主导大型AI产品的质量体系设计
  • 横向拓展至算法评测或AI平台研发领域,成为AI测试专家
  • 在平安体系内可晋升至测试管理岗位(如测试经理、质量总监)
  • 构建AI智能体(Agent)的端到端评测体系,包括任务规划、工具调用、多轮对话等维度
  • 研发AI驱动的自动化测试平台,将测试经验封装为Skill能力,提升测试效率
  • 参与AI产品全流程质量保障,包括功能、接口、高可用测试及架构评审
  • 精通LangChain/LangSmith等AI Agent框架,具备评测体系构建经验
  • 扎实的提示词工程能力,能设计高质量评测提示词
  • 熟悉机器学习评估指标(准确率、召回率、F1等),理解大模型原理(SFT、RAG等)

申请策略

  • 在面试中展示对AI Agent质量挑战的深刻理解,提出创新评测思路
  • 关注平安好医生的技术博客或公开演讲,了解团队技术方向
  • 突出AI Agent测试或评测项目经验,特别是基于LangChain的实践
  • 展示大模型评测方法论和实际案例,如评测指标、基准数据集使用
  • 强调自动化测试平台开发经验,尤其是AI驱动的创新方案
  • 深入学习LangChain/LangSmith框架,动手构建Agent Demo
  • 补充医疗领域知识,了解平安好医生产品线
  • 练习编写高质量评测Prompt,掌握模型行为分析技巧

面试指南

  • 结构化的STAR方法:从情境、任务、行动、结果四方面展开
  • 强调评估维度:功能正确性、稳定性、安全性、体验流畅度
  • 结合定量指标和定性分析,展示数据驱动思维
  • 如何设计一个AI Agent的端到端评测方案?请举例说明
  • 你如何评估大模型的语义理解准确性和鲁棒性?
  • 描述一个你使用LangChain构建Agent评测工具的经历
  • 在医疗AI场景下,如何保证测试覆盖模型安全维度?
  • 请谈谈你如何将测试经验封装为自动化平台能力?

匹配度报告

70
综合匹配度

平安医疗AI测试专家岗,技术前沿、发展空间大,但办公方式偏传统、WLB未知。

适合人群
适合追求技术成长和前沿领域探索的求职者,对工作生活平衡要求不高。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利70
成长发展85
工作生活50
使命价值75

薪资福利匹配

70中等

薪资面议,但平安作为上市公司提供稳定薪酬和福利,补偿性中等偏上。

薪资信号面议 (25K-45K/月)

成长发展匹配

85较高

岗位技术前沿,涉及AI Agent、大模型等新兴领域,发展空间大。

技术前沿前沿/新兴技术
技术栈AI Agent、LangChain、大模型评测、提示词工程、自动化测试
业务类型ambiguous

工作生活匹配

50较低

深圳现场办公,未提及远程或弹性,WLB信号不明,生活方式满足度一般。

工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值匹配

75中等

医疗AI领域具有社会价值,平安好医生专注健康服务,意义感较强。

行业发展高速增长赛道
社会影响正向社会影响力较高
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

中国平安 的其他在招职位

  • 法律管理岗

    中国平安 · 上海市
    AI 估算 · 15k-25k
  • 大数据分析岗

    中国平安 · 厦门市
    AI 估算 · 12k-20k
  • 银行渠道BD

    中国平安 · 上海市
    AI 估算 · 20k-30k
  • 智慧风控管理岗

    中国平安 · 深圳市
    AI 估算 · 25k-45k
  • 运维工程师

    中国平安 · 深圳市
    AI 估算 · 15k-25k

相似职位推荐

  • 顶尖应届-端侧大模型算法工程师-软件

    小米 · 深圳市
    AI 估算 · 20k-35k
  • 【国际化】审核开发专家

    小红书 · 深圳市
    AI 估算 · 30k-50k
  • 【国际化】T&S Engineer

    小红书 · 深圳市
    AI 估算 · 15k-25k
  • 大模型应用开发工程师

    顺丰速运 · 深圳市
    AI 估算 · 30k-50k
  • CJ-后端开发工程师(深圳)

    顺丰速运 · 武汉市
    AI 估算 · 15k-25k

中国平安 的其他在招职位

  • 法律管理岗

    中国平安 · 上海市
    AI 估算 · 15k-25k
  • 大数据分析岗

    中国平安 · 厦门市
    AI 估算 · 12k-20k
  • 银行渠道BD

    中国平安 · 上海市
    AI 估算 · 20k-30k
  • 智慧风控管理岗

    中国平安 · 深圳市
    AI 估算 · 25k-45k
  • 运维工程师

    中国平安 · 深圳市
    AI 估算 · 15k-25k

相似职位推荐

  • 顶尖应届-端侧大模型算法工程师-软件

    小米 · 深圳市
    AI 估算 · 20k-35k
  • 【国际化】审核开发专家

    小红书 · 深圳市
    AI 估算 · 30k-50k
  • 【国际化】T&S Engineer

    小红书 · 深圳市
    AI 估算 · 15k-25k
  • 大模型应用开发工程师

    顺丰速运 · 深圳市
    AI 估算 · 30k-50k
  • CJ-后端开发工程师(深圳)

    顺丰速运 · 武汉市
    AI 估算 · 15k-25k