Aspose.Words是一种高级Word文档处理API,用于执行各种文档管理和操作任务。API支持生成,修改,转换,呈现和打印文档,而无需在跨平台应用程序中直接使用Microsoft Word。此外,
Aspose API支持流行文件格式处理,并允许将各类文档导出或转换为固定布局文件格式和最常用的图像/多媒体格式。
Word 到 PDF 的转换通常在共享文档之前使用。可以使用各种在线 Word 到 PDF 转换器,允许您转换单个或有限数量的 Word 文档。然而,随着新兴的 MS Word 自动化和报告生成解决方案的出现,自动将 Word 转换为 PDF 已成为系统的重要组成部分。此外,DOC/DOCX 到 PDF 的批量转换需要自动完成,以最大限度地减少时间和精力。密切关注此类情况,我将向您展示如何在 Java 中以编程方式自动化将 Word DOC 或 DOCX 文档转换为 PDF 的过程。
Java Word 到 PDF 转换方案
您将在本文中了解以下 Word (DOC/DOCX) 到 PDF 的转换。
- 在 Java 中将 Word 转换为 PDF
- 在 Java 中将 Word DOC/DOCX 的选定页面转换为 PDF
- 使用特定的 PDF 标准(例如 PDF 1.5、PDF/A-1a 等)将 Word 转换为 PDF。
- 在 Java 中使用图像/文本压缩将 Word 转换为 PDF
- 将 Word 转换为具有 Java 图像自定义 JPEG 质量的 PDF
Java Word 到 PDF 转换 API
为了将 Word DOCX/DOC 转换为 PDF,我们将使用Aspose.Words for Java,这是一个强大的 Word 自动化 API,用于处理流行的文字处理格式。您可以下载 Aspose.Words for Java或使用以下配置将其安装在基于 Maven 的应用程序中。
存储库:
<repository> <id>AsposeJavaAPI</id> <name>Aspose Java API</name> <url>https://repository.aspose.com/repo/</url> </repository>
依赖:
<dependency> <groupId>com.aspose</groupId> <artifactId>aspose-words</artifactId> <version>20.1</version> <classifier>jdk17</classifier> </dependency>
在 Java 中将 Word DOC/DOCX 转换为 PDF
要将 Word 文档转换为 PDF,您只需加载 Word 文档并以“.pdf”扩展名保存即可。以下是在 Java 中将 DOCX/DOC 转换为 PDF 的步骤。
- 使用Document类加载 Word 文档。
- 使用Document.save()方法将文档保存为 PDF 。
以下代码示例显示了如何在 Java 中将 Word DOC 转换为 PDF。
// Load the Word document from disk Document doc = new Document("word.docx"); // Save as PDF doc.save("output.pdf");
Word文档
PDF文档
在 Java 中将 Word DOC/DOCX 的选定页面转换为 PDF
如果您只想将 Word 的选择性页面转换为 PDF,您可以使用PdfSaveOptions类来完成。您可以通过指定起始页的索引来转换前 N 页或一系列页面。
以下是在 Java 中将 Word DOCX/DOC 的选定页面转换为 PDF 的步骤。
- 使用Document类加载 Word 文档。
- 创建PdfSaveOptions类的实例。
- 设置起始页的索引和要转换的页数。
- 使用Document.save()方法将 Word 文档保存为 PDF 。
以下代码示例显示了如何在 Java 中将 Word DOC/DOCX 的选定页面转换为 PDF。
// Load the Word document from disk Document doc = new Document("word.docx"); PdfSaveOptions options = new PdfSaveOptions(); // Convert 3 pages starting from index 1 where 0 is the first page's index options.setPageIndex(1); options.setPageCount(3); // Save Word as PDF doc.save("output.pdf", options);
在 Java 中将 Word DOC/DOCX 转换为特定的 PDF 标准
PDF 文档可能符合各种 PDF 标准,例如 PDF/A-1a、PDF 1.5 等。如果您想将 Word 文档转换为特定的 PDF 标准,您可以使用 PdfCompliance 指定它。
以下代码示例显示了如何使用 Java 中的特定 PDF 标准将 Word DOCX 转换为 PDF。
// Load the Word document from disk Document doc = new Document("word.docx"); // Set PDFSaveOption compliance to PDF15 PdfSaveOptions options = new PdfSaveOptions(); options.setCompliance(PdfCompliance.PDF_15); // Convert Word to PDF doc.save("output.pdf", options);
使用 Java 中的文本或图像压缩将 Word 转换为 PDF
您还可以通过压缩 Word 文档中的文本或图像来减小生成的 PDF 文档的大小。您可以使用Aspose.Words for Java在 Word 到 PDF 转换中应用以下压缩。
文本压缩选项
Aspose.Words for Java为PdfTextCompression类提供了以下文本压缩选项:
- None:没有文本压缩。
- Flate:Flate (ZIP) 压缩。
图像压缩
图像压缩选项在PdfImageCompression类中可用。
- 自动:自动为每个图像选择最合适的压缩。
- Jpeg:图像被转换为 JPEG 格式(不支持透明度)。
以下代码示例显示如何通过在 Java 中应用文本和图像压缩将 Word DOCX 转换为 PDF
// Load the Word document from disk Document doc = new Document("word.docx"); PdfSaveOptions options = new PdfSaveOptions(); // Text and image compression options.setTextCompression(PdfTextCompression.FLATE); options.setImageCompression(PdfImageCompression.AUTO); // Save Word as PDF doc.save("output.pdf", options);
在 Java 中将 Word 转换为具有 JPEG 质量的 PDF
您还可以自定义和控制 Word 到 PDF 转换中的 JPEG 质量。PdfSaveOptions.setJpegQuality用于设置 JPEG 质量,它可以从 0(最大压缩的最差质量)到 100(最小压缩的最佳质量)。
以下代码示例显示了如何在 Java 中将 Word DOCX 转换为 PDF 时指定 JPEG 质量。
// Load the Word document from disk Document doc = new Document("word.docx"); // Set Jpeg quality PdfSaveOptions options = new PdfSaveOptions(); options.setJpegQuality(100); // Convert Word to PDF doc.save("output.pdf", options);
以上便是如何使用在 Java 中将 Word DOC/DOCX 转换为 PDF,要是您还有其他关于产品方面的问题,