系统侠官网 - 最好的电脑系统下载网站!

后羿采集器 V3.5.0 官方安装版绿色破解版

  • 软件介绍
  • 人气下载
  • 下载地址
  • 网友评论
后羿收罗器是原谷歌手艺团队倾力打造的一款网页数据收罗软件,可视化点选,一键收罗网页数据,全平台,Win/Mac/Linux都可用,后羿收罗器收罗和导出全免费,无穷制宁神用,可后盾运转,速率及时显现。

后羿采集器

功效先容

  1、可视化自界说收罗流程

  全程问答式引诱、可视化操纵、自界说收罗流程。

  主动纪录和摹拟网页操纵按次。

  初级设置满意更多收罗需要。

  2、点选抽取网页数据

  鼠标点击取舍要爬取的网页内容、操纵复杂。

  可取舍抽取文本、链接、属性、html标签等。

  3、运转批量收罗数据

  软件依照收罗流程和抽取规则主动批量收罗。

  倏地不乱,及时显现收罗速率和历程。

  可切换软件后盾运转,不打搅前台事情。

  4、导出和公布收罗的数据

  收罗的数据主动表格化,自在设置字段。

  撑持数据导出到Excel等当地文件。

  和一键公布到CMS网站/数据库/微信公众号等媒体。

利用办法

  自界说收罗百度搜刮了局数据的方法

  一、创立收罗义务

  1、启动后羿收罗器,进入主界面,取舍自界说收罗并点击创立义务按钮创立 “自界说收罗义务”;

后羿采集器

  2、输出百度搜刮的URL,包含三种体例。

  手动输出:在输出框中间接输出URL,多个URL时必要换行宰割。

  点击从文件中读取体例:用户取舍一个寄存URL的文件,文件中能够有多个URL地点,地点必要换行宰割。

  批量增加体例:通过增加并调剂地点参数天生多个有法则的地点。

后羿采集器

  二、自界说收罗流程

  1、点击创立后主动翻开第一个URL进而进入自界说设置页面,默许已经创立了开始、翻开网页、停止的流程块。底部模板区用于拖拽到画布中天生新的流程块;点击翻开网页中的属性按钮,可修正翻开的网址;

后羿采集器

  2、增加输出文字流程块:在底部模板区中拖拽输出文字块到翻开网页块前面四周,当呈现暗影地区的时分能够松开鼠标,此时会主动毗连,增加实现;

后羿采集器

  3、天生完全流程图:模仿下面增加输出文字流程块的拖拽流程增加新块;

后羿采集器

  关头步调块设置先容

  准时守候用于守候后面翻开网页实现。

  点击输出框Xpath属性按钮,在属性菜单中点击图标举行点选网页中的输出框,点击输出文本属性按钮,在菜单中输出要搜刮的文本。

  用于设置点击开始搜刮按钮,点击元素的xpath属性按钮,在菜单中点击点选图标,而后点击网页中的百度一下按钮便可。

  用于设置轮回加载下一列表页。在轮回块外部的轮回前提块中设置具体前提,此处点击操纵按钮,取舍单个元素,而后在属性菜单中点击元素的xpath属性按钮,同长进行点选网页中的下一页按钮。轮回次数属性按钮可默许为0,即不制约点击下一页的次数。

  用于设置轮回抽取列表页中的数据。在轮回块外部的轮回前提块中设置具体前提,此处点击操纵按钮,取舍不流动元素列表,而后在属性菜单中点击元素的xpath属性按钮,而后在网页中一连点选两次抽取第一块和第二块元素。轮回次数属性按钮可默许为0,即不制约列表中收取字段的数目。

  用于实行点击下一页按钮操纵,点击元素xpath属性按钮,取舍利用以后轮回中元素的xpath选项。

  同理用于设置网页加载守候工夫。

  用于设置在列表页抽取的字段规则,点击属性按钮中利用轮回中的元素按钮,取舍利用轮回中的元素选项。点击元素模板属性按钮在字段表格中点击加减举行增加删除字段,增加字段利用点选操纵,即点击加号后鼠标挪动到网页元素上点击取舍。

  4、点击开始收罗,启动收罗。

后羿采集器

  三、数据收罗及导出

  1、收罗义务运转中;

后羿采集器

  2、收罗实现后,取舍“导出数据”能够把数据都导出到当地文件;

后羿采集器

  3、取舍“导出体例”,将收罗好的数据导出,这里能够取舍excel作为导出为格局;

后羿采集器

  4、收罗数据导出后以下图。

后羿采集器

下载地址

  • PC版

下载地址: