目录

Apache PDFBox是一个开源Java库,支持PDF文档的开发和转换。

引入依赖

业务代码

读取网络中的PDF文件与文件类型转换

如果本篇博客对您有一定的帮助,大家记得留言+点赞+收藏哦。


Apache PDFBox是一个开源Java库,支持PDF文档的开发和转换。

有以下中有功能 -

  • Extract Text - 使用PDFBox,您可以从PDF文件中提取Unicode文本。
  • Split & Merge - 使用PDFBox,您可以将单个PDF文件分成多个文件,并将它们合并为一个文件。
  • Fill Forms - 使用PDFBox,您可以在文档中填写表单数据。
  • Print - 使用PDFBox,您可以使用标准Java打印API打印PDF文件。
  • Save as Image - 使用PDFBox,您可以将PDF保存为图像文件,如PNG或JPEG。
  • Create PDFs - 使用PDFBox,您可以通过创建Java程序创建新的PDF文件,还可以包含图像和字体。
  • Signing - 使用PDFBox,您可以将数字签名添加到PDF文件。

 有一个教程对PDFBox的介绍很详细,这里不再多说。

PDFBox - 快速指南_学习PDFbox|WIKI教程此方法接受文件对象作为参数,因为这是一个静态方法,您可以使用类名调用它,如下所示。. 此方法接受文件对象作为参数,因为这是一个静态方法,您可以使用类名调用它,如下所示。. 此方法接受文件对象作为参数,因为这是一个静态方法,您可以使用类名调用它,如下所示。. 此方法接受文件对象作为参数,因为这是一个静态方法,您可以使用类名调用它,如下所示。. 此方法接受文件对象作为参数,因为这是一个静态方法,您可以使用类名调用它,如下所示。https://iowiki.com/pdfbox/pdfbox_quick_guide.html


引入依赖

<!--start:PDF获取第一页的图片-->
<dependency>
    <groupId>org.apache.pdfbox</groupId>
    <artifactId>pdfbox</artifactId>
    <version>2.0.20</version>
</dependency>
<!--end:PDF获取第一页的图片-->

业务代码

/**
 * 截取PDF中的某一页作为缩略图,并上传(保存)
 * @param pdfFileName
 * @return
 */
public  String PDFFramer(String pdfFileName){

    //将网络中的PDF文件转换成file
    File file = URLToFile(pdfFileName);
    //new File() 只能访问本地文件
    //将本地文件转换成file
    //File file = new File("C:\\Users\\Administrator\\Downloads\\(重要必看).pdf");

    String pdfUrl="";
    try
    {
        // 打开来源 pdf
        log.info("开始截取PDF:");
        //PDDocument类的load()方法用于加载现有PDF文档
        PDDocument pdfDocument = PDDocument.load(file);
        //PDFRenderer的类将PDF文档呈现为AWT BufferedImage 
        PDFRenderer pdfRenderer = new PDFRenderer(pdfDocument);

        // 提取的页码
        int pageNumber = 0;
        // 以300 dpi 读取存入 BufferedImage 对象
        int dpi = 300;
       //Renderer类的renderImage()方法在特定页面中渲染图像
        BufferedImage buffImage = pdfRenderer.renderImageWithDPI(pageNumber, dpi, ImageType.RGB);
        // 文件类型转换
        MultipartFile multipartFile = fileCase(buffImage);
        log.info("PDF开始上传:");
        pdfUrl = fileLoad(multipartFile);
        log.info("PDF上传成功:{}",pdfUrl);

        // 关闭文档
        pdfDocument.close();
        //删除临时文件
        String s = threadLocal.get();
        log.info("临时文件的目录:"+s);

        File f=new File(s);
        boolean delete = f.delete();
        log.info("文件是否删除"+delete);

    }
    catch (InvalidPasswordException e)
    {
        e.printStackTrace();
    }
    catch (IOException e)
    {
        e.printStackTrace();
    }
    return pdfUrl;
}

读取网络中的PDF文件与文件类型转换

/**
 * 读取网络中的PDF文件
 * @param url
 * @return
 */
public  File URLToFile(String url){
    log.info("读取FastDFS上的PDF");
    //保存临时文件--jar包的相对位置
    File file1 = new File("Temporary.pdf");
    try {

        URL url1 = new URL(url);
        FileUtils.copyURLToFile(url1,file1);

    } catch (IOException e) {
        e.printStackTrace();
    }
    File absoluteFile = file1.getAbsoluteFile();
    threadLocal.set(absoluteFile.toString());
    log.info("ppt已经存储到本地"+absoluteFile.toString());
    return file1;
}



/**
 * 文件转换将BufferedImage转换成MultipartFile:为了文件上传
 * @param image
 * @return
 */
public static MultipartFile fileCase(BufferedImage image){
    //得到BufferedImage对象
   // BufferedImage bufferedImage = JoinTwoImage.testEncode(200, 200, url);
    MultipartFile multipartFile= null;
    try {
        //创建一个ByteArrayOutputStream
        ByteArrayOutputStream os = new ByteArrayOutputStream();
        //把BufferedImage写入ByteArrayOutputStream
        ImageIO.write(image, "jpg", os);
        //ByteArrayOutputStream转成InputStream
        InputStream input = new ByteArrayInputStream(os.toByteArray());
        //InputStream转成MultipartFile
        multipartFile =new MockMultipartFile("file", "file.jpg", "text/plain", input);
    } catch (IOException e) {
        e.printStackTrace();
    }
return multipartFile;

}

如果本篇博客对您有一定的帮助,大家记得留言+点赞+收藏哦。