Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

JD logo
京东
测试开发
立即应聘

测试开发

发布于 4 天前

普通员工/个人贡献者

上海市
中级经验
全职员工
仅现场办公
本科
LLM
多模态
语音
具身智能
自动化评测
数据集建设
模型评测

AI 估算 · 20k–35k

京东大厂,上海,测试开发岗位涉及AI评测,技能稀缺,薪资竞争力强,参考市场水平。

职位详情

关于这个职位

该职位负责京东大模型评测体系的建设,包括设计评测指标、构建自动化评测流程、管理数据集等

你将参与从基座模型到业务应用的全面评测,支撑模型版本迭代与业务决策
适合对AI模型评测有热情、具备技术功底和业务理解能力的候选人

最低要求

本科及以上学历,计算机、人工智能、自动化、机器人等相关专业

熟悉至少一个方向:LLM/多模态/语音/具身智能数据、训练或评测
有模型评测、Benchmark、自动化评测或数据标注相关经验优先
具备将“业务问题”转化为“可量化评测指标”的能力
对评测结果的稳定性、可复现性、统计显著性有基本认知

工作职责

参与建设覆盖文本、音视频及具身模型的统一评测体系,设计并落地模型评测方法与指标体系

面向基座模型,构建通用能力评测(理解、推理、事实性、安全性、鲁棒性等),支撑模型版本对比与演进决策
面向业务侧(客服、导购、搜索、推荐等),抽象业务目标,设计专项评测指标、用例集与评测方案
负责自动化评测与判分策略(规则 / 模型判分 / 多模型互评),并协同人工标注体系提升评测可信度
参与评测数据集建设,包括数据采样、难例挖掘、数据版本管理与评测结果分析
与工程团队协作,打通模型数据 – 实验 – 评测全链路闭环

AI 洞察

优缺点分析

优点

  • 深入接触前沿AI技术(大模型、多模态等),技能积累价值高
  • 京东平台大,业务场景丰富,个人影响力可快速扩大
  • 团队重视评测体系,专业发展路径清晰,有较大成长空间
  • 评测工作对细节要求高,需平衡精度与效率,工作强度可能较大
  • 技术更新快,需要持续学习新模型、新方法,保持竞争力
  • 适合热爱AI技术、善于逻辑分析和问题量化、有较强自驱力和学习能力的求职者

缺点 / 挑战

  • 作为支持性岗位,在推动跨团队协作时可能遇到沟通和资源协调的挑战

角色解读

  • 从评测专家成长为AI评测团队负责人,领导评测体系的持续优化
  • 横向拓展到模型训练或数据工程方向,成为全栈AI工程师
  • 深入业务场景,转型为AI产品经理或技术解决方案专家,推动AI落地
  • 设计并落地区域化、多模态等领域的模型评测体系,确保评测方法的科学性和指标的有效性
  • 构建面向基座模型的通用能力评测,如理解、推理、安全性等,支撑模型版本迭代决策
  • 推动自动化评测流程,包括规则判分、模型判分及多模型互评,提升评测效率与可信度
  • 参与评测数据集建设,进行数据采样、难例挖掘及版本管理,保证数据集的质量与时效性
  • 扎实的机器学习或AI背景,熟悉LLM、多模态、语音或具身智能等至少一个方向的数据、训练或评测方法
  • 具备将业务问题转化为可量化评测指标的能力,能够设计科学的评测方案
  • 熟悉自动化评测工具与平台,有模型评测、Benchmark或数据标注经验者优先
  • 对评测结果的稳定性、可复现性和统计显著性有深刻理解,能进行有效的数据分析

申请策略

  • 关注京东AI研究院的技术博客或开源项目,了解他们在评测方面的实践,面试中展示你的深度了解
  • 准备一个你曾经参与过的评测项目,用STAR原则详细描述你的角色和成果,突出系统性思考
  • 突出AI模型评测或相关领域的项目经验,特别是设计评测指标、构建自动化流程的经历
  • 强调将业务问题转化为技术指标的能力,可以准备具体案例说明
  • 展示对结果稳定性、统计显著性等概念的认知,体现数据分析能力
  • 如果有LLM、多模态等方向的实际经验,务必重点描述,并说明你的贡献和成果
  • 深入学习大模型(如GPT、BERT)的评测方法,了解常见Benchmark及其优缺点
  • 练习自动化评测脚本编写,熟悉Python及相关数据科学库(如pandas, numpy)

面试指南

  • 明确目标与范围:先理清评测对象、目标用户和关键维度,确保指标有业务相关性
  • 方法论设计:选择或构建合适的评测集,定义量化指标,并考虑多次抽样与统计分析
  • 实施与迭代:自动化流程,进行试跑,根据结果调整方案,确保鲁棒性
  • 你如何设计一个针对LLM的通用能力评测方案?请举例说明
  • 如何保证评测结果的稳定性和可复现性?有哪些统计方法?
  • 如何将业务问题(如客服满意度)转化为可量化的评测指标?
  • 你熟悉的自动化评测框架或工具有哪些?请描述一次实现自动化判分的经历
  • 在数据集建设过程中,如何平衡数据量和质量?如何进行难例挖掘?

匹配度报告

68
综合匹配度

京东AI评测岗位,前沿技术栈,薪资有竞争力,但WLB一般,成长空间大。

适合人群
适合重视技术成长和薪资回报,对工作生活平衡要求不高,希望在大厂前沿领域积累经验的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利75
成长发展85
工作生活50
使命价值60

薪资福利匹配

75中等

京东作为头部互联网大厂,薪资具有市场竞争力,提供有竞争力的薪酬和福利,但具体数额未在JD中明确。

薪资信号未披露(AI估算:20K-35K/月)

成长发展匹配

85较高

职位涉及前沿AI技术(LLM、多模态等),有明确的专业成长路径,但JD中未提及晋升机制。

技术前沿前沿/新兴技术
技术栈LLM、多模态、语音、具身智能、自动化评测
业务类型ambiguous

工作生活匹配

50较低

工作地点固定在上海,未提及弹性工作或远程,互联网大厂通常工作强度较大,WLB一般。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

60中等

AI评测助力模型质量提升,具有技术价值,但社会影响力不够突出;行业处于增长期。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

京东 的其他在招职位

  • 区域销售负责人

    京东 · 河北省
    AI 估算 · 20k-40k
  • 紧固件实验室检验工程师

    京东 · 江苏省
    AI 估算 · 10k-16k
  • 标案流程规划

    京东 · 北京市
    AI 估算 · 20k-35k
  • 大客户销售经理(包装标签)

    京东 · 广东省
    AI 估算 · 15k-25k
  • 后端开发工程师

    京东 · 北京市
    AI 估算 · 25k-45k

相似职位推荐

  • AI研发创新(实习生)

    中国移动 · 银川市
    AI 估算 · 3k-5k
  • Business R&D Senior Professional

    日立能源 · 重庆市
    AI 估算 · 20k-35k
  • Business R&D Entry Professional

    日立能源 · 合肥市
    AI 估算 · 15k-30k
  • Business R&D Senior Professional

    日立能源 · 重庆市
    AI 估算 · 20k-35k
  • Agentic AI Researcher (007358)

    巴斯夫 · 南京市
    AI 估算 · 20k-35k

京东 的其他在招职位

  • 区域销售负责人

    京东 · 河北省
    AI 估算 · 20k-40k
  • 紧固件实验室检验工程师

    京东 · 江苏省
    AI 估算 · 10k-16k
  • 标案流程规划

    京东 · 北京市
    AI 估算 · 20k-35k
  • 大客户销售经理(包装标签)

    京东 · 广东省
    AI 估算 · 15k-25k
  • 后端开发工程师

    京东 · 北京市
    AI 估算 · 25k-45k

相似职位推荐

  • AI研发创新(实习生)

    中国移动 · 银川市
    AI 估算 · 3k-5k
  • Business R&D Senior Professional

    日立能源 · 重庆市
    AI 估算 · 20k-35k
  • Business R&D Entry Professional

    日立能源 · 合肥市
    AI 估算 · 15k-30k
  • Business R&D Senior Professional

    日立能源 · 重庆市
    AI 估算 · 20k-35k
  • Agentic AI Researcher (007358)

    巴斯夫 · 南京市
    AI 估算 · 20k-35k