熟练掌握Python编程语言,精通Scrapy、BeautifulSoup、requests、Selenium、Playwright等爬虫相关框架和工具,能独立完成爬虫脚本开发
精通HTTP/HTTPS协议,理解Cookie、Session、Token、UA等请求机制,能分析接口参数、破解简单的JS加密、签名验证等反爬手段
具备IP池、代理、多线程/多进程爬取的实战经验,能优化爬虫性能,提升爬取效率
具备良好的问题排查能力,能快速定位爬虫运行中的异常,提出合理的解决方案
有反爬突破、高并发爬虫开发经验者优先
熟悉AI相关技术,能运用AI工具辅助处理爬虫数据清洗、文本提取、反爬策略优化等工作
具备AI与爬虫结合开发经验者优先
了解网络爬虫相关法律法规,具备合规意识,有过电商、资讯、政务等领域爬虫开发经验者优先