一、寻找依赖包

要在pig下使用lzo,我们需要第三方lib,目前我在使用的是twitter的elephant-bird,项目地址:

 



 你可以自己编译出jar文件,我比较懒直接使用maven库(search.maven.org)中的lib,地址如下:

 

# elephant-bird-pig-3.0.8.jar 
  
htt?filepath=com/twitter/elephantbird/elephant-bird-pig/3.0.8/elephant-bird-pig-3.0.8.jar 
  # elephant-bird-core-3.0.8.jar 
  
httper/elephantbird/elephant-bird-core/3.0.8/elephant-bird-core-3.0.8.jar

 

二、使用Pig Lzo (elephant-bird)



写道



> pig 
  
REGISTER 'elephant-bird-core-3.0.8.jar'; 
  
REGISTER 'elephant-bird-pig-3.0.8.jar'; 
  
rows = LOAD '/user/hdfs/test.lzo' USING com.twitter.elephantbird.pig.load.LzoTextLoader; 
  
....


 

--end