Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/小红书/数据采集&解析工程师
Xiaohongshu logo
X
小红书 (Xiaohongshu)

职位信息

北京市 / 上海市
中级经验
全职员工
仅现场办公
学历未注明
普通员工/个人贡献者

标签

GO数据解析大模型分布式爬虫信息抽取
💡

核心评价

技术前沿的大厂核心数据岗,成长空间大,薪资竞争力强,但需适应一线城市现场办公节奏。

数据采集&解析工程师

🤖 AI 估测:¥25K-45K

发布时间:28 天前

立即应聘

ℹ️关于这个职位

这是一个结合数据采集与解析的工程师岗位,主要负责设计和优化分布式爬虫系统,从互联网大规模采集网页、文档等数据,并进行清洗、结构化、信息抽取等处理
同时,需要应用大模型技术,建设和优化百亿级内容解析系统,提升数据解析的质量和效率

✓工作职责

【数据采集工程师】 工作职责 1、负责分布式爬虫系统的设计与优化 2、负责大规模广域爬虫引擎的部署、开发、维护 3、负责大规模网页数据采集系统开发,互联网资源清洗和结构化,网页转码,网页聚合,信息抽取,网页分类 【数据解析工程师】 工作职责: 1、负责百亿级搜索内容解析系统建设,持续提升解析效果和性能 2、应用大模型技术,提升数据解析质量和成功率 3、负责互联网海量数据(网页、文档、富媒体等)的去重、清洗、结构化导入、分类、信息抽取与价值评估

⭐最低要求

【数据采集工程师】 任职资格 1、3年以上爬虫 或 数据解析开发经验,熟练掌握 python、java、go 之一的语言 2、熟悉分布式爬虫架构,熟悉常见的风控策略、JS混淆、浏览器引擎 3、熟悉chromium内核/js/dom/html/css 等网页相关语言,能够完成数据解析工作,有大模型解析经验者优先 4、熟悉Linux常用命令,独立完成日常部署更新等,熟悉SSH、redis、mongodb等工具的使用 【数据解析工程师】 能力要求 1、计算机相关专业,熟练掌握 Python/Go/Java 至少一种编程语言 2、深入理解网站架构和内容组织方式,具备网页结构分析能力 2、有全网万亿级优质内容采集和挖掘经验优先 3、有头部搜索引擎公司 或 大模型公司 数据解析工作经验优先

👍优先资格

【数据采集工程师】 任职资格 3、有大模型解析经验者优先 【数据解析工程师】 能力要求 2、有全网万亿级优质内容采集和挖掘经验优先 3、有头部搜索引擎公司 或 大模型公司 数据解析工作经验优先
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

小红书 的其他在招职位

  • AI产品运营实习生

    小红书

    上海市 · 仅现场办公

  • 点点AI运营实习生 · AI图像创作

    小红书

    上海市 · 仅现场办公

  • AI Agent算法工程师

    小红书

    北京市 · 仅现场办公

  • 【27届实习】OLAP研发工程师

    小红书

    北京市 · 仅现场办公

  • 【27届实习】Ray研发工程师

    小红书

    北京市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公