优化工作:数据表分区尽量采用数值类型字段,如Date类型转换为距离1970-01-01的绝对天数。SQL语法:尽量避免betweenand的使用(查看查询计划,影响不大),多个子查询时尽量使用CTE(withvas…)查询。根据表的数据量以及大多数查询的类型设计数据分布策略(随机分布or哈希分布)以及bucketnum参数设置。冷热数据存储到不同schema相同的表中,尽量减小热数据所在表的分区数
Apache Hawq-使用问题和解决方法
通过设置HDFS的存储策略,设置某个path使用ALL_SSD,然后Hawq创建表时指定文件空间为此path
Apache Hawq功能测试,包括tpc-h、gpfdist、pxf、hive、hbase、hdfs等
Copyright © 2005-2024 51CTO.COM 版权所有 京ICP证060544号