1.1. 与集群交互

可以通过两种方式来连接到elasticsearch(简称es)集群,第一种是通过在你的程序中创建一个嵌入es节点(Node),使之成为es集群的一部分,然后通过这个节点来与es集群通信。第二种方式是用TransportClient这个接口和es集群通信。


1.1.1. Node方式

创建嵌入节点的方式如下:

import static org.elasticsearch.node.NodeBuilder.*;    
    //启动节点   
    Node node = nodeBuilder().node();   
    Client client = node.client();    
    //关闭节点  
    node.close();

当你启动一个节点,它会自动加入同网段的es集群,一个前提就是es的集群名(cluster.name)这个参数要设置一致。

默认的话启动一个节点,es集群会自动给它分配一些索引的分片,如果你想这个节点仅仅作为一个客户端而不去保存数据,你就可以设置把node.data设置成false或 node.client设置成true。下面是例子:

Node node = nodeBuilder().clusterName(clusterName).client(true).node();

还有一种情况是你并不想把节点加入集群,只想用它进行单元测试时,就要启动一个“本地”的es,这里“本地”指的是在jvm的级别下运行,即两个不同的es节点运行在同一个JVM中时会组成一个集群。它需要把节点的local参数设置成true,下面是例子:

Node node = nodeBuilder().local(true).node();


1.1.2. TransportClient方式(较直观,推荐)

通过TransportClient这个接口,我们可以不启动节点就可以和es集群进行通信,它需要指定es集群中其中一台或多台机的ip地址和端口,例子如下:

Client client = new TransportClient()   
            .addTransportAddress(new InetSocketTransportAddress("host1", 9300))   
            .addTransportAddress(new InetSocketTransportAddress("host2", 9300));   
    client.close();

    如果你需要更改集群名(默认是elasticsearch),需要如下设置:

Settings settings = ImmutableSettings.settingsBuilder()   
                    .put("cluster.name", "myClusterName").build();   
    Client client = new TransportClient(settings);

你可以设置client.transport.sniff为true来使客户端去嗅探整个集群的状态,把集群中其它机器的ip地址加到客户端中,这样做的好处是一般你不用手动设置集群里所有集群的ip到连接客户端,它会自动帮你添加,并且自动发现新加入集群的机器。代码实例如下:

Settings settings = ImmutableSettings.settingsBuilder()   
                    .put("client.transport.sniff", true).build();   
TransportClient client = new TransportClient(settings);


1.2. put Mapping定义索引字段属性

Mapping,就是对索引库中索引的字段名及其数据类型进行定义,类似于关系数据库中表建立时要定义字段名及其数据类型那样,不过es的mapping比数据库灵活很多,它可以动态添加字段。一般不需要要指定mapping都可以,因为es会自动根据数据格式定义它的类型,如果你需要对某些字段添加特殊属性(如:定义使用其它分词器、是否分词、是否存储等),就必须手动添加mapping。有两种添加mapping的方法,一种是定义在配置文件中,一种是运行时手动提交mapping,两种选一种就行了。

先介绍在配置文件中定义mapping,你可以把[mapping名].json文件放到config/mappings/[索引名]目录下,这个目录要自己创建,一个mapping和一个索引对应,你也可以定义一个默认的mapping,把自己定义的default-mapping.json放到config目录下就行。json格式如下:

{  
       "mappings":{  
          "properties":{  
             "title":{  
                "type":"string",  
                "store":"yes"  
             },  
             "description":{  
                "type":"string",  
                "index":"not_analyzed"  
             },  
             "price":{  
                "type":"double"  
             },  
             "onSale":{  
                "type":"boolean"  
             },  
             "type":{  
                "type":"integer"  
             },  
             "createDate":{  
                "type":"date"  
             }  
          }  
       }  
    }

当然,也可以通过请求添加mapping,可以在官方文档中搜索相关api示例。

同时,可以使用elasticssearch的rest api进行CURD(创建/create、检索/retrieve、更新/update、删除/delete)操作。HTTP协议中给出了可在API调用中作为谓词使用的一个相当长的请求类型列表。全速的选择是使用GET获取所请求的对象当前对象,使用POST来改变当前对象的状态,使用PUT来创建对象,使用DELETE来销毁对象,另外还有HEAD用于提取对象的基本信息。