登山虎收罗器V2是一款撑持99%的网站数据收罗的高效网页信息收罗软件,它能天生Excel表格,api数据库文件等外容,匡助你办理网站数据信息,假如您必要对某个指定网页数据举行收罗,利用这款软件便可。
软件特征
一键提取数据
复杂易学,通过可视化界面,鼠标点击便可抓取数据。
倏地高效
内置一套高速浏览器内核,加上HTTP引擎形式,完成倏地收罗数据。
合用各类网站
可以收罗互联网99%的网站,包含单页使用Ajax加载等等静态范例网站。
功效先容
导游形式
复杂易用,轻松通过鼠标点击主动天生。
剧本准时运转
可依照企图准时运转,无需野生。
首创高速内核
自研的浏览器内核,速率缓慢,远超敌手。
智能辨认
关于网页中的列表、表单布局(多选框下拉列表等)可以智能辨认。
告白屏障
定制的告白屏障模块,兼容AdblockPlus语法,可增加自界说规则。
多种数据导出
撑持Txt 、Excel、MySQL、SQLServer、SQlite、Access、网站等。
利用办法
第一步:输出收罗网址。
翻开软件,新建义务,输出必要收罗的网站地点。
第二步:智能剖析,全程主动化提取数据。
进入到第二步后,登山虎收罗器全主动智能剖析网页,而且从中提掏出列表数据。
第三步:导出数据到表格、数据库、网站等。
运转义务,将收罗到的数据导出为Csv、Excel以及各类数据库,撑持api导出。
罕见成绩
问:怎样过滤列表中的前N个数据?
1.偶然咱们必要对收罗到的列表举行过滤,好比过滤掉第一组数据(在收罗表格时,过滤掉表格列名)。
2.点击列表形式菜单中的,设置列表xpath。
问:怎样抓包猎取Cookie,而且手动设置?
1.起首,利用Google浏览器翻开要收罗的网站,而且上岸。
2.而后按下 F12,会呈现开辟者东西,取舍 Network。
3.而后按下F5,革新下页面, 取舍个中一个哀求。
4.复制实现后,在登山虎收罗器中,编纂义务,进入第三步,指定HTTP Header。
更新日记
1.增添插件功效。
2.增添导出 txt (一条保留为一个文件)。
3.多值毗连符撑持换行符。
4.修正数据处置的文本映照(撑持查找交换)。
5.修补上岸时的DNS成绩。
6.修补图片下载成绩。
7.修补 json 一些成绩。