libhdfs简介
libhdfs是hadoop为C/C++访问分布式文件系统提供的JNI接口。
配置环境:
linux:CentOS5.5
hadoop:hadoop-0.21.0
jdk:jdk1.6.0_26
libhdfs环境变量配置
把libhdfs需要的jar包加入CLASSPATH中。因为不知道所需的jar包是哪些,并且因为配置的hadoop版本也不同,因此肯定能跑的方法就是将全部jar包添加进CLASSPATH变量内。PS:直接将两个目录包进去好像是不行的,也不知道为什么。
使用root用户执行命令
vim /etc/profile
打开profile文件,在文件尾部添加
# #号开头的为注释,文件内是不需要的
#libhdfs所在的文件夹$HADOOP_HOME/hdfs/src/c++/libhdfs.PS:可能跟你的版本不一样
#java的头文件所在文件夹$JAVA_HOME/include:$JAVA_HOME/include/Linux,也就是jni所在文件夹
export C_INICLUDE_PATH=$HADOOP_HOME/hdfs/src/c++/libhdfs:$JAVA_HOME/include:$JAVA_HOME/include/Linux
#
export LD_LIBRARY_PATH=/usr/local/hadoop/hadoop-0.21.0/c++/Linux-i386-32/lib:/usr/java/jdk1.6.0_26/jre/lib/i386/server
#将$HADOOP_HOME目录下的jar包全部添加
for i in $HADOOP_HOME/*.jar
do
CLASSPATH=$CLASSPATH:$i
done
#将$HADOOP_HOME/lib目录下的jar全部添加
for i in $HADOOP_HOME/lib/*.jar
do
CLASSPATH=$CLASSPATH:$i
done
export CLASSPATH
动态链接库的配置
添加动态链接库到/etc/ld.so.conf.f中,使用root权限输入命令
vim /etc/ld.so.conf.d/hdfs.conf
java的动态链接库路径$JAVA_HOME/jre/lib/i386/serverlibhdfs的动态链接库路径$HADOOP_HOME/c++/Linux-i386-32/lib向里面添加java的动态链接库路径和libhdfs的动态链接库路径
/usr/java/jdk1.6.0_26/jre/lib/i386/server/usr/local/hadoop/hadoop-0.21.0/c++/Linux-i386-32/lib
保存退出后,执行命令使其生效
ldconfig -v
Makefile文件
linux下编过程序都知道,当多文件时,使用makefile文件是必不可少的。你也可以使用命令行,只不过繁琐一点而已。
HADOOP_HOME=/usr/local/hadoop/hadoop-0.21.0
PLATFORM=Linux-i386-32
JAVA_HOME=/usr/java/jdk1.6.0_26
CPPFLAGS= -I$(HADOOP_INSTALL)/hdfs/src/c++/libhdfs
LIB = -L$(HADOOP_HOME)/c++/Linux-i386-32/lib
libjvm=/usr/java/jdk1.6.0_26/jre/lib/i386/client/libjvm.so
LDFLAGS += -lhdfs
hadoop: hadoop.c
gcc hadoop.c $(CPPFLAGS) $(LIB) $(LDFLAGS) $(libjvm) -o hadoop
clean:
rm hadoop
libhdfs测试代码
#include "hdfs.h"
int main(int argc, char **argv) {
hdfsFS fs = hdfsConnect("192.168.1.147", 9000);//default为本地文件系统,ip地址为HDFS系统
const char* writePath = "/tmp/testfile.txt";//要事先创建一个测试文件
hdfsFile writeFile = hdfsOpenFile(fs, writePath, O_WRONLY|O_CREAT, 0, 0, 0);
if(!writeFile) {
fprintf(stderr, "Failed to open %s for writing!\n", writePath);
exit(-1);
}
char* buffer = "Hello, World!";
tSize num_written_bytes = hdfsWrite(fs, writeFile, (void*)buffer, strlen(buffer)+1);
if (hdfsFlush(fs, writeFile)) {
fprintf(stderr, "Failed to 'flush' %s\n", writePath);
exit(-1);
}
hdfsCloseFile(fs, writeFile);
}
执行并测试
在makefile文件的目录下执行命令
第一条:make第二条:./hadoop
打开浏览器输入你的HDFS地址http://192.168.1.147:50070
进入HDFS系统查看是否存在此文件。
点击Browse the filesystem进入
进入/tmp查看到文件testfile.txt。证明上传成功!
常见错误
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
问题:Exception in thread "main" java.lang.NoClassDefFoundError:org/apache/commons/configuration/Configuration……
解决方案:
肯定是CLASSPATH路径没有设置正确,没有添加到所需的jar包,回到上文查看libhdfs环境变量配置即可。
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
问题:error while loading shared libraries: libhdfs.so.0:cannot open shared object file: No such file or directory
解决方案:
先将libhdfs.so.0删除rm ./libhdfs.so.0
重新创建一个链接ln -s ./libhdfs.so.0.0.0 ./libhdfs.so.0
在/etc/ld.so.conf中加入一行/usr/local/hadoop/hadoop-0.21.0/c++/Linux-i386-32/lib
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
※问题:配置环境后,提示CLASSPATH=……:No such file or directory
解决方案:
还是CLASSPATH配置错误。如循环添加hadoop的jar包,直接复制网上代码,从而导致出错。
原因是网上代码与vim内字符集不同,CLASSPATH=$CLASSPATH:$i 前面的空格与vim内看似一样实则不一样,因此我一个下午就废在这里了。