hbase开放lzo压缩

转载

mob604757042166 2015-10-03 16:39:00

文章标签 hadoop java hdfs java代码版本号 文章分类 代码人生

hbase仅仅支持对gzip的压缩,对lzo压缩支持不好。

在io成为系统瓶颈的情况下，一般开启lzo压缩会提高系统的吞吐量。

但这须要參考详细的应用场景，即是否值得进行压缩、压缩率是否足够等等。

想要hbase支持lzo压缩，參照下面步骤：

1 首先要让系统支持lzo动态库。安装lzo-2.00以上版本号： 2 默认安装完后应该在系统的/usr/local/lib/找到liblzo*等几个so

4 拷贝3中下载的hadoop-gpl-compression-0.1.0-dev.jar 或hadoop-gpl-compression-0.1.0.jar 到 hbase/lib以及hadoop/lib 中

5 拷贝3中下载的 lib/native/* 到 hadoop/lib/native 及 hbase/lib/native

6 确保以上4/5中的文件同步到了每台regionserver上

7 在core-site.xml中加上：

Xml代码

<property>
<name>io.compression.codecs</name>
<value>com.hadoop.compression.lzo.LzoCodec,com.hadoop.compression.lzo.LzopCodec</value>
</property>
<property>
<name>io.compression.codec.lzo.class</name>
<value>com.hadoop.compression.lzo.LzoCodec</value>
</property>

<name>io.compression.codecs</name>

<value>com.hadoop.compression.lzo.LzoCodec,com.hadoop.compression.lzo.LzopCodec</value>

</property>

<name>io.compression.codec.lzo.class</name>

<value>com.hadoop.compression.lzo.LzoCodec</value>

</property>

8 重新启动dfs及hbase，建表时使用：

Java代码

create 'mytable', {NAME=>'colfam:', COMPRESSION=>'lzo'}

create 'mytable',{NAME=>'colfam:', COMPRESSION=>'lzo'}

此时这个column即为lzo了，往它读写数据会自己主动进行lzo压缩和解压缩。

P.S:

1 假设不清楚你的hbase是否配置好了支持lzo，能够运行下面命令检查之，假设不支持的话这个命令会提示你还缺什么文件:

Java代码

hbase org.apache.hadoop.hbase.util.CompressionTest hdfs://namenode:9000/test_path lzo

hbaseorg.apache.hadoop.hbase.util.CompressionTest hdfs://namenode:9000/test_path lzo

2 假设你和我一样使用了CDH3版本号的hdfs。那么该版本号的hdfs与hadoop-gpl-compression会有冲突，原因是CDH3改动了compression.java，添加了reinit()接口。

此时须要又一次编译hadoop-gpl-compressionproject，改动 src/java/com/hadoop/compression/lzo/LzoCompressor.java，添加下面行：

Java代码

public void reinit(Configuration conf) {
// do nothing
}

public void reinit(Configuration conf) {

// do nothing

}

然后又一次编译project，将生成的jar包替换以上第4步中的那个jar包

。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：企业与员工谁放弃了谁——放弃企业等于放弃自己，企业能为你提供学习的平台，锻炼的机会

下一篇：网络协议及tcp协议详解（超清楚的大图，难得还解释了会话层和表示层。服务端有一个保活计时器，时间通常是设置为2小时。发送一个探测报文段，以后每隔75秒钟发送一次，一连发送10个探测报文）

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

hbase开放lzo压缩

hbase开放lzo压缩

51CTO博客