工具适用于从PDF中提取可复制(非图片格式)的表格数据,并输出表格
有的PDF资料直接从里面复制出来的内容格式很友好的不用用此工具,此工具仅对粘贴格式不友好时提高效率。

官网链接:https://tabula.technology/

安装说明:

  1. Windows和Linux用户需要先安装Java。你可以在这里下载Java
  2. 点击这里下载Tabula安装包
  3. 直接解压文件夹后,双击exe文件即可启动,启动比较慢耐心等待
  4. 程序将自动打开浏览器并跳转到http://localhost:8080/,如果没有跳转手动转

使用说明:

  1. 上传包含表格的PDF文件,点击Browse或把文件拖到这个按钮上来,点击import。
  2. 浏览器会打开PDF预览,找到你要提取的表格,用鼠标框选要提取的信息,可连续多个选择。
  3. 单击Preview & Export Extracted Data。Tabula将尝试提取数据并显示预览。检查数据以确保其正确无误。如果缺少数据,您可以返回调整选择。
  4. 单击“导出”按钮。
最后修改日期:2020-06-09

作者

留言

撰写回覆或留言

发布留言必须填写的电子邮件地址不会公开。