Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/京东/软件开发岗
JD logo
J
京东 (JD)

职位信息

北京市
中级经验
全职员工
仅现场办公
本科
普通员工/个人贡献者

标签

逆向工程数据清洗大模型
💡

核心评价

京东大厂AI数据工程岗,技术前沿成长快,薪资竞争力强,但需面对一线城市现场办公与可能的快节奏。

软件开发岗

🤖 AI 估测:¥25K-40K

发布时间:26 天前

立即应聘

ℹ️关于这个职位

这是一个专注于为大型语言模型(LLM)训练提供数据支持的软件开发岗位
你将负责设计和优化智能爬虫系统,从文本、语音、视觉等多源渠道采集高质量数据,并进行预处理以满足大模型的训练需求
核心工作包括应对反爬技术、构建自动化抓取平台,并持续优化数据采集的效率和适用性

✓工作职责

结合大模型训练需求,设计和优化高效、智能化的爬虫系统,进行多源(文本、语音、视觉)数据采集
针对大模型数据预处理要求,优化爬虫数据格式和质量,提升爬取的数据对训练和推理的适用性
结合大模型场景,构建半自动/自动化定向抓取能力,推进数据抓取工作平台化建设
跟进最新的反爬技术与反制策略,持续优化爬虫架构和性能

⭐最低要求

本科及以上学历,计算机科学、人工智能、网络安全等相关专业
3年以上爬虫开发及逆向工程经验,有大模型或AI相关领域的爬虫应用经验者优先
熟悉并能绕过常见的反爬技术(如动态网页加载、验证码、JS加密等)
精通Python或其他编程语言,熟悉爬虫框架(如Scrapy、Selenium、Playwright等)
熟悉大模型训练和数据处理流程,能够根据模型需求调整数据抓取策略
熟悉常见网络协议(HTTP/HTTPS)和接口抓取,能够对复杂数据进行高效提取和清洗

👍优先资格

有大规模数据抓取与处理经验,尤其是针对大模型训练数据的采集和优化
熟悉数据加密与解密技术,能够破解复杂的加密算法
具备AI或大模型领域的技术背景,能够理解和支持模型数据需求
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

京东 的其他在招职位

  • 采销岗位

    京东

    江苏省 · 仅现场办公

  • 运营经理岗

    京东

    重庆市 · 仅现场办公

  • 客户经理岗

    京东

    成都市 · 仅现场办公

  • 客户经理岗

    京东

    广东省 · 仅现场办公

  • 运营经理岗

    京东

    四川省 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公