下载安卓APP箭头
箭头给我发消息

客服QQ:3315713922

pdf文档提取与转换库:ICEpdf

作者:课课家教育     来源: http://www.kokojia.com点击数:1152发布时间: 2016-01-24 13:44:34

标签: java类库java开发Java

想学设计?来看看大师是如何完成作品的?

  ICEpdf是一种开源,轻量级的 java 语言的 PDF 类库,用于展示/查看PDF文档,转换和抽取PDF文档的内容,还可以集成到Java桌面应用程序或web服务器中使用。ICEpdf的API采用100%纯Java编写,快速高效,使用简单。

  ICEpdf的优势:与java客户端无缝整合,通过配置完全控制功能和用户接口;易于开发和使用,无需任何其他PDF工具支持;可作为独立的PDF查看工具,也可以嵌入到其它PDF查看器组件中;轻松的将PDF转换成图片文件(PNG,JPEG或者GIF),这些工作都可以很容易在Java服务器端完成;支持所有PDF内置字体;支持PDF文档的增量加载,方便快速读取数据量较大的文件;支持adobe标砖密码保护;支持读取PDF注释标记信息;

pdf文档提取与转换库:ICEpdf_java类库_java开发_Java_课课家

  环境配置

  最基本的要安装JDk

  我没有用开发平台,所以就将icepdf包放在jdk安装目的jre->lib->ext文件夹里面

  使用问题

  如果单独去抽取的话是绝对没有问题的,但是当你加上一个循环以后,java程序占用的内存就会直线上升,主要是setInputStream这个函数的问题,他是一次性将pdf读入到内存。

  可以用来做什么?

  1、从pdf文件中提取所有的文字或信息,比如给pdf文档做摘要

  2、把pdf转换成图片,这个功能非常的棒,比如给pdf文件做缩略图或者直接做一个纯js的pdf阅读器。

  3、pdf文档的分页打印和信息搜索

  4、pdf中添加、修改或删除批注信息。

  在pdf到图片转换方面,最好的开源产品。

赞(21)
踩(1)
分享到:
华为认证网络工程师 HCIE直播课视频教程