位图也称像素图像或点阵图像,是由多个点组成的,这些点被称为像素。位图可以模仿照片的真实效果,具有表现力强、细腻、层次多和细节多等优点。BMCP 是采用无损压缩方法对位图图片进行压缩的。

bmp压缩成jpg python 源码 bmp格式如何压缩_BMCP

此算法并不高深,各位专业人士可以飘过了Orz.并且如果各位知道一些图片格式与压缩算法的话,从中应该可以看到一些相似的"影子".


PS:本人非专业人士,以下有说错的敬请各位谅解:)


什么是位图?

位图也称像素图像或点阵图像,是由多个点组成的,这些点被称为像素。位图可以模仿照片的真实效果,具有表现力强、细腻、层次多和细节多等优点。


图片的压缩格式

在Windows系统中,我们常见的bmp图片文件(bitmap file)就是位图图片。位图图片的文件大小一般都是最大的(这个可以从上上面的定义可知),不便于存储和传输,所以后来才出现了一些"压缩"格式图片,比如:gif,tiff,jpeg,png等等图片文件。


图片"压缩"又分为"有损压缩"和"无损压缩":


有损压缩 : 顾名思意就是还原出来的图片有失真现象,或者简单的说就是此还原图片不再是原来的图片。(如jpeg图片)

无损压缩 : 也即是不会有失真现象,还原出来的图片和原有图片是一模一样的。(如tiff图片)


根据不同的压缩格式与算法,最终的压缩图片文件大小也不尽相同,但一般都比位图文件小!!(如果不小还有意义吗?

bmp压缩成jpg python 源码 bmp格式如何压缩_BMCP_02



PS: jpeg也可以是无损压缩



好了,上面简单的说了几个概念,现在回归正传,说一下下面的图片压缩算法,为了方便,我在这里简称为“BMCP”压缩格式。


BMCP 是采用无损压缩方法对图片进行压缩的,其处理流程大概如下:


对一幅位图的所有象素点进行扫描,取出所有象素点的颜色构造颜色表,并且记录这些象素点的颜色在颜色表中的索引位置,然后再对这些索引位置记录进行压缩后再存储数据,也就是存储的时候象素点位置只存储索引而不存储颜色!!(看到这里大家想到哪种格式图片没有?)


我们都知道一张图按行/列扫描时某个点的颜色在它后面连续同时出现的机率是很大的,所以我们的压缩就在这里了。简单的压缩原理用伪代码表示如下:

color = 图片的第一点象素点颜色;
while(图片的象素点没有扫描完)
    newColor = 获取当前象素点的颜色;
    if(newColor == color)
    {
        color的出现次数+1;
    }else{
        存储color;
        color = newColor;
    }
}

这样压缩后,我们就可以将一些连续出现的颜色点压缩为一个颜色点了。例如有下面的字符数据:

abceefaccccch

经我们压缩后就可以变为如下数据了:

a1b1c1e2f1a1c5h1

(注:字符后面的数字表示其连续出现的次数)

嗯?也许你会说这个看起来怎么字符反而多了?别急,在图片世界里,这样压缩还是有不错效果的,除非那个图片是很变态的,不会有两个以上相同颜色点出现!!!


BMCP的颜色索引值的存储:

我们大家都知道在bmcp里是存储颜色索引值的,而大家也知道在C#里的int/uint是占用4个字节空间的,所以我们存储象素颜色索引时肯定尽量避免存储为int/uint值!

在bmcp里颜色索引值的存储大小是根据颜色表的数量来决定的。当颜色表的颜色数量小于255个时索引占用的空间就只占用1个字节;而颜色表的数量小于ushort值范围时索引占用的空间就是2个字节;而如果颜色表数量小于ushort.MaxValue*255时就索引就占用3个字节(前2个字节存储的是“值/255”的整数部分,而后1个字节则存储的是“值%255”);否则就只能使用4个字节存储索引。

在上面的压缩计解中,我们还要存储一个“颜色连接出现的次数”值,这个值的大小在bmcp里是占用1个字节的,也就是说计算某颜色重复出现的次数时只最多只能记录到255次,如果还继续出现同一个颜色,则重新记录颜色!为什么要这样做呢?这是为了减少占用空间所做的,在很多图片中,不连续出现相同颜色的位置所占的比率也是很大的,而连续出现同一种颜色超出255次的地方则是少之又少。


BMCP的文件格式

讲解完上面后,我们就可以整理出BMCP的文件存储格式了,如下表:

地址

大小

说明

0x000000

4个字节

bmcp标识字符

0x000004

1个字节    

扩展位,暂时不使用,本来打算是用来存储扫描方式的,也就是区别行扫描还是列扫描(在图片高大于宽时列扫描有可能压缩率更高)

0x000005

4字节

图片的宽度

0x000009

4字节

图片的高度

0x00000d

4字节

颜色表的颜色总数

0x0000011

n*4字节

颜色表数据,n代表颜色表的总数,每个颜色占用4个字节

0x000????

n*m字节

图片各象素点的颜色索引。
n代表象素点的总数(压缩后),m代表颜色索引值+1字节的连续出现的次数的总占用的空间(如颜色表的总数小于255则占用2字节)



好了,到此讲解完成,大概也知道BMCP是如何做到压缩位图文件的吧?

1。只存储每个象素点颜色索引值

2。将连续出现相同颜色的多个象素点压缩为一个“象素点”


经测试用BMCP压缩的位图文件大小基本和TIFF压缩的大小相差不多,但在颜色表数量较少时压缩出来的图片文件大小则小于TIFF格式图片。


源码下载:


使用示例:

bmp压缩成jpg python 源码 bmp格式如何压缩_图片压缩_03

        

//压缩
            Kingthy.Library.Image.Bmcp.Compress(@"g:\g.bmp", @"g:\g.bmcp");
            //还原图片
            using (Bitmap image = Kingthy.Library.Image.Bmcp.Decompress(@"g:\g.bmcp"))
            
{
                image.Save(@"g:\g.dc.bmp",ImageFormat.Bmp);
            }