1,重要引擎:MergeTree()
1,它可以说是clickhouse中最重要的一个引擎了,主要作用是对数据排序,分区,合并,能够把数据有条理的进行存储与分配,默认是大于五条数据更新一次,同样也可以手动更新:optimize table 表名 final; 可以提前更新相同的数据合并在同一个文件,根据clickhouse的底层优化机制,合并后,多余的文件会在一段时间后自动销毁,减少空间浪费。
2,衍生引擎:ReplacingMergeTree()
1,这是一个去重的引擎,可以根据排序字段值重复的可以去除,取最后插入的数据,同样可以分为有版本,和无版本的类型,就是在ReplacingMergeTree(xxx),括号内填上需要根据那个字段去重。
3,衍生引擎:CollapsingMergeTree()
1,使用这个引擎可以实现对数据的更新,实现的是以增代查的思想,就是增加要删除的数据,给这个数据打上一个标记(-1),可以在数据合并的时候对该条数据进行删除,或者对该条数据更新,总而言之就是标记是删除数据,还是更新数据,但是弊端也是有的,就是如果先是标记-1在前,标记1在后会造成数据混乱,从而造成数据冗余。(由于数据写入数据多线程并行写入情况下,状态行与取消行位置可能乱序,导致无法正常折叠)
4,衍生引擎:VersionedCollapsingMergeTree()
1,这个引擎可以解决上面标记问题,通过增加版本编号使删除数据更加安全,解决CollapsingMergeTree乱序写入情况下无法正常折叠(删除)问题 ,增加版本号字段,可以有效解决删除不成功问题。
5,衍生引擎:SummingMergeTree()
1,它能够在合并分区的时候按照预先定义的条件聚合汇总数据,将同一分组下的多行数据汇总合并成一行,这样既减少了数据行,又降低了后续汇总查询的开销。