Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/深度求索/高级数据采集工程师
Deepseek logo
D
深度求索 (Deepseek)

职位信息

浙江省-杭州市
高级经验
全职员工
仅现场办公
学历未注明
普通员工/个人贡献者

标签

分布式系统NLP数据工程信息抽取网页爬虫
💡

核心评价

技术驱动型岗位,聚焦前沿数据采集与处理,技能成长空间大,薪资竞争力需面议确认。

高级数据采集工程师

🤖 AI 估测:¥25K-40K

发布时间:22 天前

立即应聘

ℹ️关于这个职位

这是一个专注于从互联网高效、合规地获取和处理公开数据的技术岗位
你将负责设计并开发分布式数据采集系统,研究网页信息抽取算法,并确保数据采集、解析、入库全流程的稳定与高效
核心目标是利用技术手段提升数据采集的规模、质量和性能

✓工作职责

遵循robots 协议,对互联网公开信息进行采集
负责网页信息抽取技术算法的研究和开发,提升数据采集的效率和质量
负责设计和开发分布式的网络数据采集技术,能独立解决实际开发过程碰到的各类问题(优化调度、并发、覆盖率等) ,提升数据采集的效果与性能
负责数据采集解析入库、系统异常监控与警报等

⭐最低要求

具备扎实的编程能力、优秀的设计能力和代码品味,具有强烈的责任心
熟练掌握HTML、JavaScript、Python、Scrapy等,能快速完成采集脚本的编写
了解主流网络数据采集技术和框架工具,如Selenium/Puppeteer/PhantomJS/Scrapy等
了解NLP基本技术
熟悉常见限制访问服务器资源和获取数据技术,具备相关的实战经验

👍优先资格

实际使用过如 Fasttext、N-gram、Bert、GPT 等算法和模型者优先
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

深度求索 的其他在招职位

  • AI超算集群运维工程师

    深度求索

    杭州市 · 仅现场办公

  • 多模态安全-模型策略产品经理

    深度求索

    北京市 · 仅现场办公

  • 企业文化主管

    深度求索

    杭州市 · 仅现场办公

  • 会计

    深度求索

    杭州市 · 仅现场办公

  • 采购经理

    深度求索

    杭州市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公