Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/京东/高级ai评测工程师
JD logo
J
京东 (JD)

职位信息

北京市
高级经验
全职员工
仅现场办公
学历未注明
普通员工/个人贡献者

标签

自动化测试生成式AI团队指导质量保障大语言模型Ai评测Opencompass
💡

核心评价

京东大厂高级AI评测岗,技术前沿性强,成长空间大,薪资预期高,但工作地点固定且WLB可能面临挑战。

高级ai评测工程师

🤖 AI 估测:¥35K-55K

发布时间:28 天前

立即应聘

ℹ️关于这个职位

这是一个面向AI产品的高级评测工程师岗位,主要负责构建AI产品的评测体系,保障从模型研发到上线的全流程质量
你将独立设计评测方案、开发自动化工具链,并针对大语言模型、生成式AI等前沿技术进行专项评测
同时,需要与算法、产品、研发团队深度协作,推动评测结果驱动产品迭代

✓工作职责

AI产品评测体系构建:独立负责AI产品(NLP/CV/多模态等)的评测方案设计、指标制定与实施,覆盖准确性、鲁棒性、公平性、用户体验等维度,开发自动化评测工具链,构建可复用的评测框架与基线数据集
全生命周期质量保障:主导从模型研发到上线的全流程评测,包括但不限于:数据质量评估、模型版本对比、A/B测试、线上效果监控,针对大语言模型(LLM等)、生成式AI等前沿方向设计专项评测方案
技术赋能与团队成长:主导技术难点攻关(如幻觉检测、提示词对抗测试等),沉淀方法论并培训团队成员,搭建团队知识库,定期组织技术分享,提升整体AI评测能力
跨团队协同:与算法、产品、研发团队深度协作,推动评测结果驱动产品迭代

⭐最低要求

5年及以上AI/算法测试或评测经验,计算机/人工智能相关专业背景
精通AI评测技术栈:熟悉主流评测框架(如HELM、OpenCompass等)及工具(如PromptBench、FMEval),掌握Python/Java,具备评测脚本开发及自动化平台搭建能力
有完整主导2个以上AI产品评测项目的经验(需在面试中详细阐述)
具备评测体系设计视角,能根据产品阶段灵活调整评测策略,优秀的逻辑分析能力,能针对模型失效场景提出可解释的归因分析,有团队指导经验,擅长知识传递与流程规范化建设,熟悉大模型微调、RAG技术原理及对应评测方法
符合京东价值观:客户为先、创新、拼搏、担当、感恩、诚信
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

京东 的其他在招职位

  • 采销岗位

    京东

    江苏省 · 仅现场办公

  • 运营经理岗

    京东

    重庆市 · 仅现场办公

  • 客户经理岗

    京东

    成都市 · 仅现场办公

  • 客户经理岗

    京东

    广东省 · 仅现场办公

  • 运营经理岗

    京东

    四川省 · 仅现场办公

相似职位推荐

  • 游戏测试-UE在研

    叠纸游戏

    上海市 · 仅现场办公

  • 品质管理组长-IP开发

    叠纸游戏

    上海市 · 仅现场办公

  • 软件测试工程师

    小马智行

    广州市 · 仅现场办公

  • 高级测试工程师 - 北京亦庄

    小马智行

    北京市 · 仅现场办公

  • 运营质量专员

    小马智行

    广州市 · 仅现场办公