霍夫曼编码(英语:Huffman Coding),又译为哈夫曼编码赫夫曼编码,是一种用于无损​​数据压缩​​的​​熵编码​​(权编码)​​算法​​。由​​大卫·霍夫曼​​在1952年发明。

在​​计算机​​​​数据处理​​中,霍夫曼编码使用​​变长编码表​​对源符号(如文件中的一个字母)进行编码,其中​​变长编码表​​是通过一种评估来源符号出现概率的方法得到的,出现概率高的字母使用较短的编码,反之出现概率低的则使用较长的编码,这便使编码之后的字符串的平均长度、​​期望值​​降低,从而达到​​无损压缩​​数据的目的。

例如,在英文中,e的出现​​概率​​最高,而z的出现概率则最低。当利用霍夫曼编码对一篇英文进行压缩时,e极有可能用一个​​比特​​来表示,而z则可能花去25个​​比特​​(不是26)。用普通的表示方法时,每个英文字母均占用一个​​字节​​,即8个​​比特​​。二者相比,e使用了一般编码的1/8的长度,z则使用了3倍多。倘若我们能实现对于英文中各个字母出现概率的较准确的估算,就可以大幅度提高无损压缩的比例。

霍夫曼树又称最优二叉树,是一种带权路径长度最短的二叉树。所谓树的带权路径长度,就是树中所有的叶结点的权值乘上其到根结点的路径长度(若根结点为0层,叶结点到根结点的路径长度为叶结点的层数)。树的路径长度是从树根到每一结点的路径长度之和,记为WPL=(W1*L1+W2*L2+W3*L3+...+Wn*Ln),N个权值Wi(i=1,2,...n)构成一棵有N个叶结点的二叉树,相应的叶结点的路径长度为Li(i=1,2,...n)。可以证明霍夫曼树的WPL是最小的。