Base128编码规范

原创

XOSG 2020-12-20 10:32:45 ©著作权

©著作权归作者所有：来自51CTO博客作者XOSG的原创作品，请联系作者获取转载授权，否则将追究法律责任

Base128编码规范_python

Base64与Base128

其实Base128和Base64没什么联系，只是沿用了这种命名规范而已。Base64是通过选取256个ASCII字符中的64个可打印字符，将任意的二进制字节流转换成字符串。根据信息论一一映射原理，任意的Base64“无字符意义的”的字符流，每个字节的最高2位都是0，相当于：

00xxxxxx 00xxxxxx 00xxxxxx......

这样的话，每个字节就有2bit浪费掉了，总浪费量是1/4，也就是说Base64要求把每三个8Bit的字节转换为四个6Bit的字节（3*8 = 4*6 = 24），然后把6Bit再添两位高位0，组成四个8Bit的字节，也就是说，转换后的字符串理论上将要比原来的长1/3。

但是Base128编码是另外一种编码，也叫variable-length quantity（VLQ），即一种变长编码。我准备用3期来详细谈谈Base128以及基于它的Zipack格式。

以下内容来自Zipack格式的README：

https://github.com/zipack/spec/blob/master/README-zh.md

Zipack

官网：https://zipack.gitee.io/

规范（英文）：spec.md

这个仓库保存Zipack的规范，并且和Github仓库同步更新。Zipack是一套高效的二进制序列化格式，比JSON更小更快，支持更多的数据类型。在字符串和小数的编码上，Zipack采用原创的算法来取代臃肿的UTF-8和IEEE浮点数。

文件后缀名：.zipack

mime类型：application/zipack

优点

你可以直接用Zipack取代JSON，同时ByteArray类型让你可以插入二进制文件而无须使用臃肿的Base64编码。由于Zipack是无格式的，你也可以选择利用保留类型来预交换格式。常见的使用场景包括内存缓存、RPC通信协议、配置文件等。

当今最流行的序列化格式无疑是JSON，但是基于文本的JSON有许多缺点，比如解析速度慢，体积较大。而只有基于前缀的二进制格式能克服这些问题。所以我设计了一个紧凑的、无协议的二进制序列化格式Zipack用来取代JSON，为数据的存储和传输提供更好的方案。

Zipack只是一个格式，想要投入使用，我们需要开发相应的软件。目前作者已经开发出JavaScript版本的编解码器：zipack.js。但是我需要你的帮助来共同建设Zipack的生态，请参考spec.md开发其他编程语言的zipack工具。

坐标：江浙沪一带

Github：https://github.com/jinhengyu

Gitee：https://gitee.com/jinhengyu

Base128编码规范_算法_02

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯