Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/京东/评测产品运营
JD logo
J
京东 (JD)

职位信息

北京市
中级经验
全职员工
仅现场办公
本科
普通员工/个人贡献者

标签

SQLRAGLLMSFTRLHF数据敏感度模型评测算法产品
💡

核心评价

京东科技LLM评测运营岗,技术前沿、成长性强、平台稳定,适合追求技术深度的开发者。

评测产品运营

🤖 AI 估测:¥30K-50K

发布时间:4 天前

立即应聘

ℹ️关于这个职位

这是一个专注于大语言模型(LLM)评测与效果优化的产品运营岗位
你将负责从0到1搭建模型评测体系,通过自动化评测与人工标注流程,持续优化模型在搜索推荐等业务场景下的表现
核心工作是将用户反馈转化为高质量训练数据,驱动模型能力迭代,平衡效果、成本与延迟

✓工作职责

搭建与迭代模型评测体系,针对不同业务场景,定义多维度的评估指标,设计并推动自动化评测集机制,同时搭建高效的人工标注与验收流程
模型效果调优与策略制定,建立常态化的 BadCase 归因分析机制,设计SFT、RLHF训练数据策略,包括数据清洗标准、样本配比、合成数据等
结业务场景与模型能力,平衡效果、延迟与成本,设计线上用户反馈机制,将用户行为数据转化为模型训练的高质量样本,构建反馈优化的数据飞轮

⭐最低要求

本科及以上学历,有搜索推荐算法策略背景,或 NLP 领域从业背景优先
具备算法产品经验,其中至少 1 年以上 LLM 相关实战经验
具备0 到 1 搭建模型评测体系的经验,或主导过大规模复杂场景下的模型效果优化项目
深刻理解 Transformer 原理,熟悉主流开源模型的特性
理解 Pre-train, SFT, RLHF, RAG 的全流程逻辑
熟悉业界主流评测集(如 C-Eval, MMLU, GSM8K),并能针对垂直领域设计专有的评测集
具备极强的数据敏感度,熟练使用 Python 或 SQL 进行数据分析和 Case 挖掘(不仅仅是看报表,能自己动手洗数据者加分)
对模型效果提升有执念,能够通过指标拆解将模糊的“体验好坏”转化为可量化的技术目标
符合京东价值观:客户为先、创新、拼搏、担当、感恩、诚信
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

京东 的其他在招职位

  • 采销岗位

    京东

    江苏省 · 仅现场办公

  • 运营经理岗

    京东

    重庆市 · 仅现场办公

  • 客户经理岗

    京东

    成都市 · 仅现场办公

  • 客户经理岗

    京东

    广东省 · 仅现场办公

  • 运营经理岗

    京东

    四川省 · 仅现场办公

相似职位推荐

  • 支付产品经理

    中国平安

    上海市 · 仅现场办公

  • 营销活动经理

    中国平安

    深圳市 · 仅现场办公

  • 产品经理

    中国平安

    青岛市 · 仅现场办公

  • 票据产品岗

    中国平安

    上海市 · 仅现场办公

  • 产品经理

    中国平安

    深圳市 · 仅现场办公