基本上来说传统关系型数据库(以MySQL为例)的SQL语句,ClickHouse基本都支持,这里不会从头讲解SQL语法只介绍ClickHouse与标准SQL(MySQL)不一致的地方。
1、insert
基本与标准SQL(MySQL)基本一致
insert into [table_name] values(…),(….)
insert into [table_name] select a,b,c from [table_name_2]
2、update/delete
ClickHouse提供了Delete和Update的能力,这类操作被称为Mutation查询,它可以看做Alter 的一种。虽然可以实现修改和删除,但是和一般的OLTP数据库不一样,Mutation语句是一种很“重”的操作,而且不支持事务。“重”的原因主要是每次修改或者删除都会导致放弃目标数据的原有分区,重建新分区。所以尽量做批量的变更,不要进行频繁小数据的操作。
删除
alter table t_order_smt delete where sku_id ='sku_001';
更新
alter table t_order_smt update total_amount=toDecimal32(2000.00,2) where id =102;
由于操作比较“重”,所以 Mutation语句分两步执行,同步执行的部分其实只是进行新增数据新增分区和并把旧分区打上逻辑上的失效标记。直到触发分区合并的时候,才会删除旧数据释放磁盘空间,一般不会开放这样的功能给用户,由管理员完成。
总结:1、不支持事务,2、同过alert 间接实现了delete/update 功能, 这是一个比较重的操作,会生成新的临时分区,合并后才会清空过期数据,相当于重新写了一份数据,3、设计一些标记字段,定期清除老的数据。
3、查询
ClickHouse基本上与标准SQL 差别不大
- 支持子查询
- 支持CTE(Common Table Expression 公用表表达式 with 子句)
- 支持各种JOIN, 但是JOIN操作无法使用缓存,所以即使是两次相同的JOIN语句,ClickHouse也会视为两条新SQL
- 窗口函数处于实验阶段
- 不支持自定义函数
- GROUP BY 操作增加了 with rollup\with cube\with total 用来计算小计和总计。
删除所有数据
hadoop201 :) aalter table t_order_mt delete where 1=1;
ALTER TABLE t_order_mt
DELETE WHERE 1 = 1
Ok.
0 rows in set. Elapsed: 0.010 sec.
hadoop201 :) select * from tselect * from t_order_mt;select * from t_order_mt;
SELECT *
FROM t_order_mt
Ok.
插入数据
insert into t_order_mt values
(101,'sku_001',1000.00,'2022-05-18 12:00:00'),
(102,'sku_002',2000.00,'2022-05-18 12:00:00'),
(103,'sku_004',2500.00,'2022-05-18 12:00:00'),
(104,'sku_002',2000.00,'2022-05-18 12:00:00'),
(105,'sku_003',600.00,'2022-05-19 12:00:00'),
(106,'sku_001',1000.00,'2022-05-22 12:00:00'),
(107,'sku_002',2000.00,'2022-05-22 12:00:00'),
(108,'sku_004',2500.00,'2022-05-22 12:00:00'),
(109,'sku_002',2000.00,'2022-05-22 12:00:00'),
(110,'sku_003',600.00,'2022-05-18 12:00:00');
with rollup:从右至左去掉维度进行小计
select id, sku_id, sum(total_amount)
from t_order_mt
group by id, sku_id
with rollup;
# 结果
102 sku_004 5000.00
102 sku_002 33200.00
101 sku_001 2000.00
102 "" 38200.00
101 "" 2000.00
0 "" 40200.00
with cube : 从右至左去掉维度进行小计,再从左至右去掉维度进行小计
select id, sku_id, sum(total_amount)
from t_order_mt
group by id, sku_id
with cube;
102 sku_004 5000.00
102 sku_002 33200.00
101 sku_001 2000.00
102 "" 38200.00
101 "" 2000.00
0 sku_004 5000.00
0 sku_001 2000.00
0 sku_002 33200.00
0 "" 40200.00
with totals: 只计算合计
select id, sku_id, sum(total_amount)
from t_order_mt
group by id, sku_id
with totals;
102 sku_004 5000.00
102 sku_002 33200.00
101 sku_001 2000.00
4、alter
同MySQL的修改字段基本一致
新增字段
alter table tableName add column newcolname String after col1;
修改字段类型
alter table tableName modify column newcolname String;
删除字段
alter table tableName drop column newcolname;
5、导出数据
clickhouse-client --query "select * from t_order_mt where create_time='2022-05-18 12:00:00'" --format CSVWithNames> /opt/module/data/rs1.csv
更多支持格式参照:https://clickhouse.com/docs/en/interfaces/formats/