Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

JD logo
京东
评测算法工程师
立即应聘

评测算法工程师

发布于 大约 15 小时前

普通员工/个人贡献者

北京市
中级经验
全职员工
仅现场办公
本科
人工智能
机器学习
LLM
多模态
数据标注
京东
评测
自动化评测

AI 估算 · 25k–40k

京东大厂算法岗,技术要求高且前沿,市场竞争力强,月薪中位数约32.5K,配合15薪。

职位详情

关于这个职位

该职位负责大模型评测体系的建设与落地,包括设计评测指标、搭建自动化评测流程、构建评测数据集等

你将与数据工程和算法团队协作,推动模型效果的迭代优化
适合对AI评测感兴趣、有LLM/多模态经验的技术人才

最低要求

本科及以上学历,计算机、人工智能、自动化、机器人等相关专业

熟悉至少一个方向:LLM/多模态/语音/具身智能数据、训练或评测
具备将“业务问题”转化为“可量化评测指标”的能力
对评测结果的稳定性、可复现性、统计显著性有基本认知
符合京东价值观:客户为先、创新、拼搏、担当、感恩、诚信

工作职责

参与建设覆盖文本、音视频及具身模型的统一评测体系,设计并落地模型评测方法与指标体系

面向基座模型,构建通用能力评测(理解、推理、事实性、安全性、鲁棒性等),支撑模型版本对比与演进决策
面向业务侧(客服、导购、搜索、推荐等),抽象业务目标,设计专项评测指标、用例集与评测方案
负责自动化评测与判分策略(规则/模型判分/多模型互评),并协同人工标注体系提升评测可信度
参与评测数据集建设,包括数据采样、难例挖掘、数据版本管理与评测结果分析
与工程团队协作,打通模型数据 – 实验 – 评测全链路闭环

优先资格

有模型评测、Benchmark、自动化评测或数据标注相关经验优先

AI 洞察

优缺点分析

优点

  • 京东作为头部互联网平台,提供丰富的业务场景和海量数据,对技术成长极有帮助
  • 职位聚焦AI评测前沿方向,接触大模型、多模态等热门技术,积累稀缺经验
  • 与顶尖算法和数据工程团队协作,工作氛围技术导向,个人价值易被认可
  • 技术迭代快,需持续学习新模型和新评测方法,保持竞争力
  • 适合对AI模型评测有浓厚兴趣、逻辑严谨、且喜欢在技术前沿钻研的算法工程师

缺点 / 挑战

  • 评测工作需要严谨细致,重复性事务(如数据标注协调)可能较多,需要耐心
  • 业务对评测结果要求高,需要在效率和准确性之间平衡,压力较大

角色解读

  • 技术深耕:成为AI评测专家,主导评测体系设计与优化,输出行业标准
  • 横向拓展:向算法训练或数据工程方向延伸,成长为全栈AI研发人才
  • 管理方向:带领评测团队,负责模型评估与质量保障,晋升为技术Leader或架构师
  • 设计和落地模型统一评测体系,包括文本、音视频、具身模型等方向的评测方法与指标体系
  • 构建通用能力评测(理解、推理、事实性等)和业务专项评测(客服、导购等),支撑模型迭代决策
  • 开发自动化评测与判分策略,协同人工标注提升评测可信度,并参与评测数据集建设与难例挖掘
  • 熟悉LLM、多模态、语音或具身智能方向的数据、训练或评测,具备相关技术背景
  • 能够将业务问题转化为可量化的评测指标,对评测结果的稳定性、可复现性有深刻认知
  • 具备编程能力(如Python),熟悉自动化评测工具与流程,有Benchmark或数据标注经验者优先

申请策略

  • 深入了解京东AI业务方向(客服、搜索推荐等),在面试中展现业务理解能力
  • 关注京东技术博客和开源项目,体现对公司的关注和技术热情
  • 突出参与过的大模型或AI项目,尤其是评测、Benchmark相关经历,量化成果(如提升指标x%)
  • 强调编程能力(Python、数据处理库)和自动化评测工具开发经验
  • 展示对评测方法论的理解,例如评测维度设计、统计分析、难例挖掘等
  • 如有公开的数据集或评测论文,务必列出
  • 系统学习LLM评测主流方法(如MMLU、HumanEval、HELM等),熟悉自动化评测框架
  • 掌握数据标注工具和流程,了解人工标注与自动判分的协同机制

面试指南

  • 对于设计类问题,先明确评测目标,再拆解评测维度,最后提出量化指标和实验方案
  • 对于方法类问题,结合具体经验,从数据、过程、统计三个层面阐述保证手段
  • 对于对比类问题,分析优缺点,提出融合策略,展现辩证思维
  • 请设计一个评测方案,用于评估客服大模型的回答质量
  • 如何保证评测结果的稳定性和可复现性?
  • 你如何看待自动判分与人工标注的关系?
  • 描述一个你处理过的难例挖掘案例
  • 你对LLM的常见Benchmark(如MMLU、BIG-bench)有何了解?

匹配度报告

72
综合匹配度

京东大厂,前沿AI评测岗位,技术成长极高,但WLB一般。

适合人群
该职位最适合注重技术成长和职业发展的求职者,对WLB要求较高者需谨慎。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利80
成长发展90
工作生活50
使命价值70

薪资福利匹配

80较高

京东作为上市巨头,薪资在行业中上水平,且福利完善,但JD未明确提及具体福利,补偿性动机较好满足。

薪资信号未披露(AI估算:25K-40K/月)

成长发展匹配

90较高

职位涉及大模型、多模态等前沿技术,且负责重要评测体系建设,技能成长空间巨大,发展性动机高度满足。

技术前沿前沿/新兴技术
技术栈LLM、多模态、具身智能、自动化评测、Benchmark
业务类型profit_center

工作生活匹配

50较低

JD未提及远程或弹性工作,互联网大厂对工作强度有较高期待,WLB一般,仅现场办公。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

70中等

大模型评测对行业发展有推动作用,但JD未强调社会价值,意义感中等。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

京东 的其他在招职位

  • 站长岗(团队负责人)

    京东 · 河南省
    AI 估算 · 8k-15k
  • 产品技术专家(个人防护)

    京东 · 北京市
    AI 估算 · 30k-50k
  • 生态女装采销

    京东 · 上海市
    AI 估算 · 15k-25k
  • 内衣生态采销岗

    京东 · 北京市
    AI 估算 · 15k-25k
  • 供应链运营(运营及采控方向)

    京东 · 北京市
    AI 估算 · 15k-25k

相似职位推荐

  • Unity客户端开发工程师-【游戏事业部】

    快手 · 广州市
    AI 估算 · 15k-30k
  • 前端研发实习生-【用户体验】

    快手 · 北京市
    AI 估算 · 4k-7k
  • JAVA开发-语音后端

    中国平安 · 深圳市
    AI 估算 · 35k-50k
  • 资深Agent算法工程师

    中国平安 · 深圳市
    AI 估算 · 30k-60k
  • 算法

    中国平安 · 上海市
    AI 估算 · 25k-45k

京东 的其他在招职位

  • 站长岗(团队负责人)

    京东 · 河南省
    AI 估算 · 8k-15k
  • 产品技术专家(个人防护)

    京东 · 北京市
    AI 估算 · 30k-50k
  • 生态女装采销

    京东 · 上海市
    AI 估算 · 15k-25k
  • 内衣生态采销岗

    京东 · 北京市
    AI 估算 · 15k-25k
  • 供应链运营(运营及采控方向)

    京东 · 北京市
    AI 估算 · 15k-25k

相似职位推荐

  • Unity客户端开发工程师-【游戏事业部】

    快手 · 广州市
    AI 估算 · 15k-30k
  • 前端研发实习生-【用户体验】

    快手 · 北京市
    AI 估算 · 4k-7k
  • JAVA开发-语音后端

    中国平安 · 深圳市
    AI 估算 · 35k-50k
  • 资深Agent算法工程师

    中国平安 · 深圳市
    AI 估算 · 30k-60k
  • 算法

    中国平安 · 上海市
    AI 估算 · 25k-45k