Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/月之暗面/爬虫工程师
Moonshot AI logo
M
月之暗面 (Moonshot AI)

职位信息

北京市
高级经验
全职员工
仅现场办公
学历未注明
普通员工/个人贡献者

标签

分布式系统数据采集数据质量爬虫反爬Url调度大模型语料
💡

核心评价

技术挑战性强、成长空间大的资深爬虫工程师岗,薪资竞争力需确认,WLB信息不明。

爬虫工程师

🤖 AI 估测:¥35K-60K

发布时间:6 天前

立即应聘

ℹ️关于这个职位

该职位主要负责设计、开发和优化大规模网络爬虫系统,以高效、稳定地获取和处理海量网页数据
核心工作包括构建URL发现与调度系统、应对反爬机制、建立数据质量评估体系,并优化数据处理管线的性能
这是一个技术深度要求高、专注于数据获取底层架构的工程师岗位

✓工作职责

岗位职责
设计和优化大规模 Web 爬虫的 URL 发现与调度系统,持续扩大数据覆盖面
建设多因子抓取优先级体系,在有限资源下最大化高质量页面的获取效率
主导反爬对抗和动态渲染方案,提升核心站点的抓取成功率
建立数据质量评估闭环,从域名到页面的多层级质量管控
优化大规模数据处理管线的性能和稳定性

⭐最低要求

希望你具备以下经验
大规模搜索引擎或 Web 爬虫系统实战经验,做过百亿级以上 URL 池的全链路
深入理解全网 URL 发现的多种手段
熟悉主流反爬机制及对抗方案
扎实的分布式数据处理能力(Spark / Flink 等)

👍优先资格

强烈加分
有大模型预训练语料采集和清洗经验
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

月之暗面 的其他在招职位

  • 资深系统开发工程师

    月之暗面

    北京市 · 仅现场办公

  • Infra 系统工程师 - 训练平台

    月之暗面

    北京市 · 仅现场办公

  • 资深后端工程师-商业化

    月之暗面

    北京市 · 仅现场办公

  • Agent Engineer / Agent 工程师

    月之暗面

    北京市 · 仅现场办公

  • API解决方案架构师

    月之暗面

    上海市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公