Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/京东/大模型数据采集高级工程师
JD logo
J
京东 (JD)

职位信息

北京市
高级经验
全职员工
仅现场办公
本科
普通员工/个人贡献者

标签

GOLLM数据治理云原生分布式爬虫
💡

核心评价

京东大厂平台、前沿AI数据工程岗位,技术成长性极佳,薪资竞争力强,但WLB信息不明需注意。

大模型数据采集高级工程师

🤖 AI 估测:¥35K-60K

发布时间:26 天前

立即应聘

ℹ️关于这个职位

这是一个专注于为大模型训练提供高质量数据源的核心技术岗位
您将负责设计并实现高并发、高可用的分布式数据采集系统,从互联网上获取海量文本、图像等多模态数据
同时,您需要参与构建自动化数据处理流水线,确保数据的质量、合规性,并持续优化数据策略以提升模型训练效果

✓工作职责

设计分布式爬虫与调度策略,支撑万亿级 Token 数据供给,开发高可用采集工具,突破反爬,对接多源数据,保障日均 TB 级采集能力
参与搭建自动化清洗 / 去重 / 脱敏流水线,保障数据质量与合规性
维护采集 - 存储 - 处理全链路,监控 SLA,支持云原生与私有化部署
优化数据策略,提升数据性价比与模型对齐度

⭐最低要求

本科及以上,计算机相关专业,海量数据采集 / 爬虫 / 数据工程经验,有 LLM 数据交付经验优先
精通 Python/Go/Java 任一,熟悉分布式爬虫、反爬与数据治理
掌握 Spark/Kafka/Airflow 等技术,具备云原生部署与监控能力
熟悉数据合规与隐私保护,能独立解决高并发、高可用、高风险采集问题
符合京东价值观:客户为先、创新、拼搏、担当、感恩、诚信

👍优先资格

加分项 有万亿级预训练数据管线建设经验
掌握多模态采集与质量评估体系
具备数据安全与隐私计算实践经验
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

京东 的其他在招职位

  • 采销岗位

    京东

    江苏省 · 仅现场办公

  • 运营经理岗

    京东

    重庆市 · 仅现场办公

  • 客户经理岗

    京东

    成都市 · 仅现场办公

  • 客户经理岗

    京东

    广东省 · 仅现场办公

  • 运营经理岗

    京东

    四川省 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公