Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

PINGAN logo
中国平安
算法测试专家
立即应聘

算法测试专家

发布于 大约 16 小时前

普通员工/个人贡献者

上海市
中级经验
全职员工
仅现场办公
本科
NLP
模型评估
自动化测试
测试工具
数据集管理
大模型
CV
评测

AI 估算 · 25k–45k

大厂中级技术岗,上海薪资较高,大模型方向热门,月薪25-45K,16薪

职位详情

关于这个职位

该职位主要负责构建和维护NLP/CV/大模型的评测数据集,制定评测流程,撰写评测报告,并跟踪开源及竞品模型水平

你将参与模型测试全流程,包括用例管理、功能测试、集成测试等,确保算法质量
适合有算法评测经验、熟悉Python和Shell、对大模型领域感兴趣的求职者

最低要求

本科以上学历,有2年以上算法评测经验

自驱力和责任心强,积极主动,较强的沟通表达能力
熟练使用Python、Shell、测试工具等,能独立设计并完成测试方案

工作职责

负责构建和完善NLP/CV/大模型评测数据集,做好评测集的迭代更新和版本管理

制定规范化评测流程,撰写模型评测报告,协助算法人员评估模型过拟合程度与缺陷修复
定期跟踪开源模型和竞品模型的水平,撰写调研报告
负责NLP/CV/大模型相关项目的测试,包括不限于测试用例管理、功能测试、集成测试、回归测试、线上监控,算法评测等,保障研发和测试质量

优先资格

有NLP/CV/大模型相关开发或评测经验者,尤其大模型方向者优先

AI 洞察

优缺点分析

  • 大模型是当前最热门的技术方向,该职位能深入参与大模型评测,积累一线经验
  • 中国平安作为巨头企业,平台资源丰富,职业发展稳定
  • 工作内容涉及算法评估全流程,技能树全面,未来可转型算法开发或测试管理
  • 薪制度下总包可观,薪资竞争力强
  • 评测工作需要耐心和细心,重复性工作较多,可能考验细致度
  • 大模型迭代快速,需持续跟踪最新技术,保持学习压力
  • 上海生活成本高,且大厂可能存在加班情况
  • 适合有2年以上测试或算法评估经验,对AI大模型充满热情,注重技术深度和稳定平台,能接受一定重复性工作但追求专业成长的求职者

角色解读

  • 可向算法测试专家或质量保障负责人方向发展,负责更大范围的测试体系
  • 也可转向AI算法工程师,积累模型评估经验后深入模型开发
  • 在平安大平台,有机会接触金融科技前沿项目,拓宽行业视野
  • 构建和维护NLP/CV/大模型的评测数据集,确保数据集的质量和时效性
  • 制定规范化评测流程,撰写详细的模型评测报告,协助算法工程师定位模型缺陷
  • 跟踪开源模型和竞品模型的最新进展,输出调研报告为团队提供决策参考
  • 负责算法项目全流程测试,包括功能、集成、回归测试及线上监控,保障交付质量
  • 扎实的算法评测经验,熟悉评测指标和数据集设计方法
  • 熟练使用Python和Shell,能独立设计自动化测试方案
  • 了解NLP、CV或大模型的基本原理,有相关领域评测经验者优先
  • 具备较强的自驱力和沟通能力,能清晰输出测试报告

申请策略

  • 准备一份详细的评测项目案例,说明如何发现并推动模型优化
  • 了解平安在AI领域的布局(如平安科技),面试中展现对业务的理解
  • 突出在过往项目中构建评测数据集、设计测试方案的具体案例
  • 强调对NLP、CV或大模型的理解,尤其是模型评估指标的运用
  • 展示Python和Shell的脚本能力,以及自动化测试工具的使用经验
  • 如果有开源贡献或模型效果的对比分析经历,务必提及
  • 补充大模型评测框架(如lm-evaluation-harness)的实践经验
  • 加强数据分析能力,熟练使用pandas、matplotlib等工具进行结果可视化

面试指南

  • 采用STAR法则:情境-任务-行动-结果,清晰描述项目细节
  • 对于技术问题,先阐述理论基础,再结合实践案例,体现深入理解
  • 对于沟通类问题,强调积极主动、数据驱动和协作精神
  • 介绍你做过的一个算法评测项目,包含数据集构建、指标选择和结论
  • 如何判断模型是否过拟合?你会用哪些方法?
  • 对于大模型评测,你认为有哪些关键指标?这些指标在不同业务场景下如何取舍?
  • 你如何跟踪最新模型进展?举例说明你最近关注的一个模型及其评测结果
  • 在面对评测结果与算法团队预期不一致时,你如何处理?

匹配度报告

74
综合匹配度

大厂前沿技术岗,发展空间大,薪资可观但WLB一般。

适合人群
适合追求技术成长、关注前沿AI的求职者,如果重视WLB可能需要调整预期。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展90
工作生活50
使命价值70

薪资福利匹配

85较高

中国平安为上市巨头,薪资水平在上海有竞争力,16薪制,但JD未明确具体薪资或福利,候选人可预期市场水准以上。

薪资信号未披露 (25K-45K/月)

成长发展匹配

90较高

职位聚焦大模型评测这一前沿领域,技术栈新,个人成长空间大,JD未明确提及晋升路径,但大平台机会多。

技术前沿前沿/新兴技术
技术栈NLP、CV、大模型、评测、Python、Shell
业务类型ambiguous

工作生活匹配

50较低

上海现场办公,未提及弹性工作或远程,大厂通常有加班文化,WLB一般。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

70中等

AI大模型属于高速增长赛道,社会影响力中性,创新程度积极,但职位本身为评测支持,使命感一般。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

中国平安 的其他在招职位

  • 客户经营岗

    中国平安 · 福州市
    AI 估算 · 12k-20k
  • 座席

    中国平安 · 长春市
    AI 估算 · 4k-6k
  • 销售推动岗

    中国平安 · 上海市
    AI 估算 · 10k-18k
  • 互联网平台运营岗

    中国平安 · 深圳市
    AI 估算 · 15k-25k
  • 【金控】解决方案(咨询顾问)

    中国平安 · 深圳市
    AI 估算 · 30k-50k

相似职位推荐

  • 高级网络库SDK开发工程师

    快手 · 北京市
    AI 估算 · 35k-60k
  • 21867-软件测试工程师

    梅特勒托利多 · 上海市
    AI 估算 · 15k-25k
  • Senior Java Developer

    渣打银行 · 天津市
    AI 估算 · 25k-40k
  • 智能体应用开发实习生(J99649)

    百度 · 北京市
    AI 估算 · 6k-10k
  • AI-Infra开发工程师(可观测/运维平台方向)(J99647)

    百度 · 北京市
    AI 估算 · 25k-40k

中国平安 的其他在招职位

  • 客户经营岗

    中国平安 · 福州市
    AI 估算 · 12k-20k
  • 座席

    中国平安 · 长春市
    AI 估算 · 4k-6k
  • 销售推动岗

    中国平安 · 上海市
    AI 估算 · 10k-18k
  • 互联网平台运营岗

    中国平安 · 深圳市
    AI 估算 · 15k-25k
  • 【金控】解决方案(咨询顾问)

    中国平安 · 深圳市
    AI 估算 · 30k-50k

相似职位推荐

  • 高级网络库SDK开发工程师

    快手 · 北京市
    AI 估算 · 35k-60k
  • 21867-软件测试工程师

    梅特勒托利多 · 上海市
    AI 估算 · 15k-25k
  • Senior Java Developer

    渣打银行 · 天津市
    AI 估算 · 25k-40k
  • 智能体应用开发实习生(J99649)

    百度 · 北京市
    AI 估算 · 6k-10k
  • AI-Infra开发工程师(可观测/运维平台方向)(J99647)

    百度 · 北京市
    AI 估算 · 25k-40k