本文分享在Linux系统下,通过Java 程序代码将Word转为PDF文档时,结果文档内容出现乱码该如何解决。具体可参考如下内容:
1.问题出现的背景
在Windows系统中,使用Spire.Doc for Java将Word文档转换为PDF格式时(如下代码),结果文档内容正常;但是在Linux系统中,转出来PDF文档出现乱码或方框。
import com.spire.doc.*;
public class WordtoPDF {
public static void main(String[] args) {
Document document = new Document();
document.loadFromFile("Sample.docx");
document.saveToFile("out/toPDF.pdf", FileFormat.PDF);
}
}
2. 问题出现的原因
这个问题是由于Linux服务器缺少字体所导致。通过Spire.Doc for Java转换Word到PDF时,需要从系统中查找对应的字体绘制字形,如果系统中没有安装文档使用的字体,那么会先从系统安装了的字体匹配出能支持这个字形的字体,如果无法匹配出相应的字体,那么就会出现乱码或方框。若遇到这类问题,建议先确认Word文档中使用了哪些字体,将这些字体安装到Linux系统。
3. 问题解决办法
关于如何查看和安装字体的详细指令:
步骤1:开启root权限:
输入指令: su root ;不行时,需要先输入指令: sudo passwd root, 根据步骤输入密码,然后再重新输入指令: su root。
步骤2:将字体文件先放到某一个文件夹下,然后进入文件夹:
输入指令: cp simsun.ttc /usr/share/fonts/
然后依次输入下面的指令:
mkfontscale
mkfontdir
fc-cache-fv
步骤3:查看安装的字体文件:
查看系统中的字体
指令:fc-list
查看系统中的中文字体:
指令:fc-list:lang=zh
以上是本次关于“在Linux系统下,通过Java程序将Word转为PDF后,出现内容乱码的解决办法”的全部内容。