【直播分享】结合实例聊一聊经典的压缩算法_数据库


压缩的本质是对信息进行再编码,即相同信息使用另一种更简洁的方式重新表达。


人们在生活中到处可以看到一些压缩方法,同时也在不知不觉中使用着,如简称就是一种典型的压缩方法。“中华人民共和国”我们就简称为“中国”,“中国交通管理局”我们也习惯用“交管局”来表示,使用简称让我们提高了效率。这些压缩方法通常也需要带着一个固定的词典,在词典中把“中国”再翻译回原来的“中华人民共和国”,简称的词典都装在我们每个人的脑子里,所以可以相互交流。


下图是压缩算法的分类

【直播分享】结合实例聊一聊经典的压缩算法_tdengine_02

但即便是相同的压缩算法,在不同软件中的实现可能也会有较大差别,进而有优劣之分,这也就是为什么使用相同压缩算法的压缩软件之间压缩率及性能差别很大的原因了。


那么,压缩算法的特点和本质是什么?有哪些经典的压缩算法?压缩算法在数据库中的正确实现方法是什么?又如何为不同的数据类型选择最适合的压缩算法?


2022年1月20日20:00-21:00​,锁定TDengine直播间,涛思数据研发工程师段宽军将结合实例,从压缩算法的历史聊起,细致具体地讲解数据库中的经典压缩算法。


段宽军,TDengine研发工程师,多年来一直从事C、C++底层及内核相关研发工作,曾在腾讯负责QQ浏览器线的安全及攻防,目前在涛思数据负责流式计算、查询存储等方面的相关工作。



他将分享:

  1. 压缩算法的起源
  2. 压缩算法的分类
  3. 压缩算法的特点和本质
  4. 通用数据库中压缩算法介绍
  5. TDengine中压缩算法的使用