1:在hh15\hh16\hh17上启动hbase集群:
先启动zookeeper-3.4.6:#sh /home/zookeeper-3.4.6/bin/zkServer.sh start
再启动hdfs:
#start-dfs.sh
#start-yarn.sh
最后启动hbase:#start-hbase.sh
2:设计索引库的settings信息和mappings信息,并把这些配置信息保存到一个配置文件中。
在hh15的/opt/soft/目录下编写bjcom.json文件
vi bjcom.json
{
"settings":{
"number_of_shards":5,
"number_of_replicas":0
},
"mappings":{
"doc":{
"dynamic":"strict",
"properties":{
"id":{"type":"integer","store":"yes"},
"title":{"type":"string","store":"yes","index":"analyzed","analyzer": "ik_max_word","search_analyzer": "ik_max_word"},
"describe":{"type":"string","store":"yes","index":"analyzed","analyzer": "ik_max_word","search_analyzer": "ik_max_word"},
"author":{"type":"string","store":"yes","index":"no"}
}
}
}
}
3:安装配置es服务。
1):即整合IK中文分词工具
4:启动es
5:创建索引库
使用开始定义的文件进行创建,使用下面命令进行创建
curl -XPOST 'http://hh15:9200/bjcom' -d @bjcom.json
#curl -XDELETE 'http://hh15:9200/bjcom'
查询是否正常
#curl -XGET 'http://hh15:9200/bjcom'
6:创建hbase表:
#create 'doc','cf1'
7:利用”G:\testhbase\doc.txt”文件创建索引
打开idea15,添加项目:es_hbase_new,然后启动tomcat项目
在浏览器访问:
#curl 'http://192.168.1.28:8080'
再创建索引:
#curl 'http://192.168.1.28:8080/create.do'
再搜索万度一下:
#curl 'http://192.168.1.28:8080/search.do?keyWords=2008&pageNum=1'
再模拟点击查看详情
#curl 'http://192.168.1.28:8080//detailDocById/2.do'
(以下5是参考他人意思)
5:初始化数据
把原始数据在es中建立索引,并且还要在hbase中保存一份。
需要使用提供的代码里面的一个类(DataImportAndIndex.java)
1:使用hbaseutils工具类的时候,要注意修改zk的IP地址和hbase.rootdir的地址
conf.set("hbase.zookeeper.quorum", "192.168.142.115:2181");
/**
* 注意:如果使用这个地址无法访问的话请尝试使用这个
* hdfs://chenkl/hbase
* 因为hadoop这边做了HA,现在主为197,备为196
*/
conf.set("hbase.rootdir", "hdfs://chenkl/hbase");
还需要修改本机的hosts文件,不然hbase工具类无法正常调用
2:使用es工具类的时候要注意:
修改es的ip地址
addIndex方法需要实现