Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/京东/算法开发
JD logo
J
京东 (JD)

职位信息

北京市
中级经验
全职员工
仅现场办公
本科
普通员工/个人贡献者

标签

机器学习LLM多模态数据标注自动化评测模型评测
💡

核心评价

大厂核心业务的前沿技术岗,高成长潜力,薪资竞争力强,但需适应现场办公节奏。

算法开发

🤖 AI 估测:¥25K-45K

发布时间:19 天前

立即应聘

ℹ️关于这个职位

这是一个专注于大模型评测的算法开发岗位
你将负责构建覆盖文本、音视频及具身模型的统一评测体系,设计并落地模型评测方法与指标体系
工作内容包括面向基座模型和业务侧(如客服、导购)设计评测方案,并负责自动化评测与判分策略,协同工程团队打通模型数据-实验-评测全链路闭环

✓工作职责

参与建设覆盖文本、音视频及具身模型的统一评测体系,设计并落地模型评测方法与指标体系
面向基座模型,构建通用能力评测(理解、推理、事实性、安全性、鲁棒性等),支撑模型版本对比与演进决策
面向业务侧(客服、导购、搜索、推荐等),抽象业务目标,设计专项评测指标、用例集与评测方案
负责自动化评测与判分策略(规则 / 模型判分 / 多模型互评),并协同人工标注体系提升评测可信度
参与评测数据集建设,包括数据采样、难例挖掘、数据版本管理与评测结果分析
与工程团队协作,打通模型数据 – 实验 – 评测全链路闭环

⭐最低要求

本科及以上学历,计算机、人工智能、自动化、机器人等相关专业
熟悉至少一个方向:LLM/多模态/语音/具身智能数据、训练或评测
有模型评测、Benchmark、自动化评测或数据标注相关经验优先
具备将“业务问题”转化为“可量化评测指标”的能力
对评测结果的稳定性、可复现性、统计显著性有基本认知
符合京东价值观:客户为先、创新、拼搏、担当、感恩、诚信

👍优先资格

有模型评测、Benchmark、自动化评测或数据标注相关经验优先
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

京东 的其他在招职位

  • 采销岗位

    京东

    江苏省 · 仅现场办公

  • 运营经理岗

    京东

    重庆市 · 仅现场办公

  • 客户经理岗

    京东

    成都市 · 仅现场办公

  • 客户经理岗

    京东

    广东省 · 仅现场办公

  • 运营经理岗

    京东

    四川省 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公