WayneShao 的博客

记录精彩的程序人生
fullpagescreenshot 0 篇文章

Selenium PhantomJS 巧妙过渡到 Firefox/Chrome

PhantomJSObsoleteOrigin 前段时间因为一些个人爱好,想要对某网站的数据进行整站采集,其中需要对某些页面的一些区块进行截图采集,整个采集任务中还涉及一些验证码识别之类的工作。学艺不精,我当前掌握的 Scrapy 知识很难完成这样一个爬虫,就使用了 Selenium+PhantomJS 制作了一个模拟浏览器访问来爬取数据的小爬虫,完成了整套抓取任务。然而上个月手误格掉了整块数据硬盘,之前的代