1:在hh15\hh16\hh17上启动hbase集群:

先启动zookeeper-3.4.6:#sh /home/zookeeper-3.4.6/bin/zkServer.sh start

再启动hdfs:

#start-dfs.sh    

#start-yarn.sh

最后启动hbase:#start-hbase.sh

 

2:设计索引库的settings信息和mappings信息,并把这些配置信息保存到一个配置文件中。

在hh15的/opt/soft/目录下编写bjcom.json文件

vi bjcom.json

{

"settings":{

"number_of_shards":5,

"number_of_replicas":0

},

"mappings":{

"doc":{

"dynamic":"strict",

"properties":{

"id":{"type":"integer","store":"yes"},

"title":{"type":"string","store":"yes","index":"analyzed","analyzer": "ik_max_word","search_analyzer": "ik_max_word"},

"describe":{"type":"string","store":"yes","index":"analyzed","analyzer": "ik_max_word","search_analyzer": "ik_max_word"},

"author":{"type":"string","store":"yes","index":"no"}

}

}

}

}

 

3:安装配置es服务。

1):即整合IK中文分词工具

4:启动es

5:创建索引库

使用开始定义的文件进行创建,使用下面命令进行创建

curl -XPOST 'http://hh15:9200/bjcom' -d @bjcom.json

  

   #curl -XDELETE 'http://hh15:9200/bjcom' 

   查询是否正常

   #curl -XGET  'http://hh15:9200/bjcom' 

 

6:创建hbase表:

#create 'doc','cf1'

 

7:利用”G:\testhbase\doc.txt”文件创建索引

打开idea15,添加项目:es_hbase_new,然后启动tomcat项目

在浏览器访问:

#curl 'http://192.168.1.28:8080'

再创建索引:

#curl 'http://192.168.1.28:8080/create.do'

再搜索万度一下:

#curl 'http://192.168.1.28:8080/search.do?keyWords=2008&pageNum=1'

再模拟点击查看详情

#curl 'http://192.168.1.28:8080//detailDocById/2.do'

 

 

(以下5是参考他人意思)

5:初始化数据

把原始数据在es中建立索引,并且还要在hbase中保存一份。

需要使用提供的代码里面的一个类(DataImportAndIndex.java)

 

1:使用hbaseutils工具类的时候,要注意修改zk的IP地址和hbase.rootdir的地址

conf.set("hbase.zookeeper.quorum", "192.168.142.115:2181");

/**

 * 注意:如果使用这个地址无法访问的话请尝试使用这个

 * hdfs://chenkl/hbase

 * 因为hadoop这边做了HA,现在主为197,备为196

 */

conf.set("hbase.rootdir", "hdfs://chenkl/hbase");

 

还需要修改本机的hosts文件,不然hbase工具类无法正常调用

 

2:使用es工具类的时候要注意:

修改es的ip地址

addIndex方法需要实现