Parquet是一种流行的列式存储格式,可以高效地存储具有嵌套字段的记录,还可以针对相同类型的列进行压缩。

介绍:

Spark SQL读取parquet文件_嵌套

使用:

Spark SQL读取parquet文件_列式存储_02