本文以Java代码为例介绍如何实现将HTML文件转为Word文档(.docx、.doc)。在实际开发场景中可参考此方法来转换。下面详细方法及步骤。

在编辑代码前,请先在程序中导入Spire.Doc.jar,导入方法如下:

方法1:将 Free Spire.Doc for Java包​​下载​​到本地,解压,找到lib文件夹下的Spire.Doc.jar文件。然后在IDEA中打开“Project Structure”界面,然后执行如图步骤来手动导入本地路径下的jar文件:

Java 将HTML转为Word_jar

方法2:通过​​Maven仓库​​下载导入,如下配置pom.xml:

<repositories>
<repository>
<id>com.e-iceblue</id>
<name>e-iceblue</name>
<url>https://repo.e-iceblue.cn/repository/maven-public/</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>e-iceblue</groupId>
<artifactId>spire.doc.free</artifactId>
<version>5.2.0</version>
</dependency>
</dependencies>

 完成导入后,执行如下代码来转换:

Java

import com.spire.doc.*;
import com.spire.doc.documents.XHTMLValidationType;

public class HTMLtoWord {
public static void main(String[] args) {
//加载html文件
Document doc = new Document();
doc.loadFromFile("F:\\IDEAProject\\Conversion_Doc\\暴雨避险指南.html", FileFormat.Html, XHTMLValidationType.None);

//保存为Word格式到指定路径
doc.saveToFile("htmltoWord.docx",FileFormat.Docx_2013);
}
}

Java 将HTML转为Word_格式转换_02


—END—