PDFlux是一款智能表格提取的神器,今朝有撑持macOS、Win系统、小步伐以及浏览器插件,能够一键辨认、一键提取PDF、扫描件、图片中的表格、文本段落、图片等因素,让用户可以可以智能的提取来自PDF的表格,而且还可以举行文件下面的转换,信任这是良多的用户在办公大概进修傍边所碰到的成绩,pdf傍边回避表格提取酿成了十分大的成绩,利用十分便利。
软件功效
表格辨认。
精准辨认无线框表格。
精准辨认庞大排版页面的表格。
精准辨认表格外部单位格兼并。
跨页表格主动兼并。
撑持扫描件的表格辨认:去除印章、角度改正。
格局转换
将PDF转化为Word、Excel、HTML等格局。
将PDF转化为EPUB、MOBI等电子书格局,能够在手机或Kindle等电纸书上浏览。
精准保存文本段落、表格等外容块信息。
精准辨认文档的章节目次布局。
撑持庞大排版的PDF文档的转换。
SaaS办事
供应一套完全易用的REST API,供盘算机挪用,让您把PDF庞大格局抛诸脑后。
将PDF文档剖析为文本段落、表格、图片等外容块的序列,保存原文档的浏览按次。
撑持中英文多栏庞大排版的PDF文档剖析,跨栏和跨页内容块智能主动兼并。
智能辨认表格的外部布局:单位格兼并,单位格文字的对齐体例、缩进、色彩、加粗、斜体等款式信息,跨页和跨栏表格智能兼并单位格文字。
智能辨认文档的目次布局,撑持多达10个层级,长文档信息抽取必不行少。
支持后续各种文档智能的使用:PDF文档全文检索、文档级别信息抽取等。
更新日记
Version 3.10.4
2020-04-10
1、修补一般扫描件扭转异样、Toolbar交互异样。
2、修补一般扫描件单位格内容折行、对齐体例异样。
3、优化辨认表格交互和相干提醒信息。