常见的压缩格式:Snappy,LZO,Gzip,bzip2,deflate
hadoop中压缩及存储常见格式图解_Hadoop
hadoop中压缩及存储常见格式图解_Hadoop_02
常见的存储格式:
储存格式指的是Hdfs 中存储文件的格式,常用的有SequnceFile、RCFile、Parquet和TextFile
SequnceFile
hadoop中压缩及存储常见格式图解_Hadoop_03
RCFile:
hadoop中压缩及存储常见格式图解_Hadoop_04
ORCFile:
hadoop中压缩及存储常见格式图解_Hadoop_05
Parquet :
hadoop中压缩及存储常见格式图解_Hadoop_06