使用八爪鱼采集器抓取网页数据

学智社 人气:6.53K

php抓取网页内容比较常用的是借助第三方类编写抓取代码,其中QueryList是一个基于phpQuery的通用列表采集类,是一个简单、 灵活、强大的采集工具,也比较常用,但是对于一些不用代码想要抓取网页内容的人来说,八爪鱼是一个不错的选择。

使用八爪鱼采集器抓取网页数据

操作方法

(01)首先搜索八爪鱼,进入八爪鱼官网,点击下载八爪鱼安装包;

使用八爪鱼采集器抓取网页数据 第2张
使用八爪鱼采集器抓取网页数据 第3张

(02)安装之后注册账号登录,登录之后进入软件主页,点击任务->新建->自定义采集,输入要采集网页的网址保存即可;

使用八爪鱼采集器抓取网页数据 第4张

(03)保存之后软件会自动打开该页面,你可以鼠标依次点击页面中要抓取的内容,也可以在右侧操作提示区域点击取消要抓取的内容;确定无误后点击采集即可;

使用八爪鱼采集器抓取网页数据 第5张
使用八爪鱼采集器抓取网页数据 第6张

(04)保存采集之后选择启用本地采集,之后静静等待就可以看到采集到的数据了;采集出的数据你也可以选择导出;此外,八爪鱼也可以同时采集多个页面,只需要在开始输入网址的时候输入多个网址即可;

使用八爪鱼采集器抓取网页数据 第7张
使用八爪鱼采集器抓取网页数据 第8张