Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

JD logo
京东
算法开发岗
立即应聘

算法开发岗

发布于 1 天前

普通员工/个人贡献者

北京市
中级经验
全职员工
仅现场办公
本科
机器学习
数据处理
LLM
多模态
语音
具身智能
自动化评测
模型评测

AI 估算 · 25k–45k

京东作为互联网巨头,AI算法岗薪资有竞争力,结合北京市场和社招要求,估算月薪25K-45K。

职位详情

关于这个职位

该职位主要负责构建覆盖文本、音视频及具身模型的统一评测体系,涉及模型能力评估、自动化评测策略设计及评测数据集建设

你将与工程团队协作,打通模型全链路闭环,支撑业务侧模型应用优化
适合对AI模型评测有浓厚兴趣的算法工程师

最低要求

本科及以上学历,计算机、人工智能、自动化、机器人等相关专业

熟悉至少一个方向:LLM/多模态/语音/具身智能数据、训练或评测
有模型评测、Benchmark、自动化评测或数据标注相关经验优先
具备将“业务问题”转化为“可量化评测指标”的能力
对评测结果的稳定性、可复现性、统计显著性有基本认知

工作职责

参与建设覆盖文本、音视频及具身模型的统一评测体系,设计并落地模型评测方法与指标体系

面向基座模型,构建通用能力评测(理解、推理、事实性、安全性、鲁棒性等),支撑模型版本对比与演进决策
面向业务侧(客服、导购、搜索、推荐等),抽象业务目标,设计专项评测指标、用例集与评测方案
负责自动化评测与判分策略(规则 / 模型判分 / 多模型互评),并协同人工标注体系提升评测可信度
参与评测数据集建设,包括数据采样、难例挖掘、数据版本管理与评测结果分析
与工程团队协作,打通模型数据 – 实验 – 评测全链路闭环

AI 洞察

优缺点分析

优点

  • 京东作为头部互联网公司,平台大、资源多,能接触到大规模真实业务场景
  • 职位聚焦模型评测,属于AI领域新兴方向,技术含量高,积累经验后竞争力强
  • 团队属于探索研究院,有机会参与前沿技术研究,与顶尖人才合作
  • 跨部门协作较多,需要与业务、工程、标注团队紧密配合,沟通成本不低
  • 技术迭代快,需要持续学习新模型和新评测方法,保持知识更新
  • 适合对AI模型评测有热情、善于逻辑分析和数据驱动决策的算法工程师,喜欢在技术深度与业务落地之间寻找平衡

缺点 / 挑战

  • 模型评测需要细致耐心,可能涉及大量重复性数据工作,对细节要求高

角色解读

  • 从评测工程师向AI模型全栈专家发展,深入理解模型能力与业务需求的匹配
  • 可转向模型训练、数据科学或AI平台架构方向,积累跨领域经验
  • 在京东探索研究院接触前沿技术,未来可晋升为技术负责人或专家
  • 设计并建设覆盖文本、音视频、具身模型的统一评测体系,制定评测指标与方法
  • 面向基座模型进行通用能力评测,支持模型版本对比和演进决策
  • 面向业务场景(如客服、搜索)设计专项评测方案,并推动自动化评测落地
  • 参与评测数据集建设,包括采样、难例挖掘与版本管理
  • 熟悉LLM/多模态/语音/具身智能中的至少一个方向,了解模型训练或评测
  • 具备将业务问题转化为可量化评测指标的能力,能设计合理的评测方案
  • 了解自动化评测策略(规则/模型判分/多模型互评)及统计显著性概念
  • 有Python等编程能力,能处理数据并协同工程团队打通全链路

申请策略

  • 在面试中展现你对模型评测核心挑战(如公平性、鲁棒性、可复现性)的思考
  • 关注京东价值观,在回答中体现客户为先、创新拼搏等元素
  • 突出你在LLM/多模态/语音等方向的项目经验,尤其是涉及模型评测或Benchmark的经历
  • 强调将业务问题拆解为量化指标的能力,可举例说明过往如何设计评估方案
  • 展示自动化评测或数据标注平台建设经验,体现工程化思维
  • 如有关于评测稳定性、统计显著性分析的成果,务必详细描述
  • 提前学习主流Benchmark(如MMLU、Hellaswag、GLUE等)的设计思路和计算方法
  • 掌握自动化评测工具链,如Hugging Face evaluate库、自建判分脚本等

面试指南

  • 对于开放性问题,先明确问题边界(场景、资源、目标),再分维度提出指标(如准确性、流畅性、安全性)
  • 对于稳定性问题,从数据集一致性、多次实验统计、随机种子控制、交叉验证等角度回答
  • 对于转化问题,展示你从用户反馈或业务指标反推评测指标的逻辑链
  • 请设计一个针对客服对话模型的评测方案,你会考虑哪些指标?
  • 如何保证评测结果的稳定性和可复现性?你遇到过哪些挑战?
  • 谈谈你对LLM评测中“事实性”和“安全性”的理解,如何量化?
  • 如果业务方提出一个模糊的优化目标(如“让回答更友好”),你如何转化为可量化的评测指标?
  • 介绍一个你参与过的模型评测项目,重点说明你的角色和贡献

匹配度报告

69
综合匹配度

京东探索研究院算法岗,聚焦AI模型评测,技术前沿,薪资有竞争力,但工作强度可能较高。

适合人群
该职位最适合追求技术成长和前沿领域发展的求职者,愿意为职业发展接受一定的生活节奏压力。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利80
成长发展85
工作生活50
使命价值60

薪资福利匹配

80较高

京东作为上市巨头,薪资福利有竞争力,但JD未明确具体数字,整体处于行业中等偏上水平。

薪资信号未披露(AI估算:25K-45K/月)

成长发展匹配

85较高

职位涉及前沿技术(具身智能、多模态等),能接触核心模型评测,成长空间大,但未明确提及培训或晋升路径。

技术前沿前沿/新兴技术
技术栈LLM、多模态、语音、具身智能、模型评测、自动化评测
业务类型ambiguous

工作生活匹配

50较低

JD未明确工作模式,但北京互联网大厂通常现场办公,存在加班可能。

工作模式未明确
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

60中等

AI评测对模型安全性和公平性有社会价值,但职位直接服务于公司业务,使命导向不明显。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

京东 的其他在招职位

  • 大客户商务经理

    京东 · 北京市
    AI 估算 · 20k-40k
  • AI产品经理岗

    京东 · 北京市
    AI 估算 · 20k-35k
  • 仓储运营

    京东 · 浙江省
    AI 估算 · 8k-15k
  • JAVA研发专家(导购)

    京东 · 广东省
    AI 估算 · 35k-55k
  • 销售岗

    京东 · 山东省
    AI 估算 · 8k-15k

相似职位推荐

  • 医疗行业解决方案架构师-火山引擎

    字节跳动 · 北京市
    AI 估算 · 35k-65k
  • 3D视觉仿真工程师/专家-PICO

    字节跳动 · 北京市
    AI 估算 · 35k-65k
  • 多媒体算法工程师(AI Infra)-视频与边缘

    字节跳动 · 上海市
    AI 估算 · 35k-65k
  • 开发工程师

    中国移动 · 贵阳市
    AI 估算 · 12k-20k
  • Dots-【Ace顶尖实习生】Long Horizon Agentic Task 能力提升研究

    小红书 · 北京市
    AI 估算 · 4k-8k

京东 的其他在招职位

  • 大客户商务经理

    京东 · 北京市
    AI 估算 · 20k-40k
  • AI产品经理岗

    京东 · 北京市
    AI 估算 · 20k-35k
  • 仓储运营

    京东 · 浙江省
    AI 估算 · 8k-15k
  • JAVA研发专家(导购)

    京东 · 广东省
    AI 估算 · 35k-55k
  • 销售岗

    京东 · 山东省
    AI 估算 · 8k-15k

相似职位推荐

  • 医疗行业解决方案架构师-火山引擎

    字节跳动 · 北京市
    AI 估算 · 35k-65k
  • 3D视觉仿真工程师/专家-PICO

    字节跳动 · 北京市
    AI 估算 · 35k-65k
  • 多媒体算法工程师(AI Infra)-视频与边缘

    字节跳动 · 上海市
    AI 估算 · 35k-65k
  • 开发工程师

    中国移动 · 贵阳市
    AI 估算 · 12k-20k
  • Dots-【Ace顶尖实习生】Long Horizon Agentic Task 能力提升研究

    小红书 · 北京市
    AI 估算 · 4k-8k