映射类型
每个索引拥有一个或多个映射类型,用来在索引中将文档分为不同的逻辑组。
每个映射类型拥有:
- 元字段:用来定义如何处理文档的元数据。元字段包括文档的_index字段、_type字段、_id字段和_source字段。
- 字段或属性:每个映射类型包含与类型相关的字段或属性列表。同一索引中不同映射类型的相同名称字段必须拥有相同的映射。
字段数据类型
每个字段拥有一个数据类型,可以是简单数据类型,比如字符串(String)、日期型(date)、长整型(long)、双精度浮点型(double)、布尔型(boolean)或者IP。
支持JSON的层次性类型,比如对象(object)、嵌套(nested),或者指定的类型,比如地理点(geo_point)、地理形状(geo_shape)。
基于不同目的对同一个字段进行不同方式的索引是很有用的。例如,一个字符串类型字段可以在全文搜索中作为分析字段,在排序或聚合时作为不分析的字段。或者,可以通过标准分析器、英文分析器或者语法分析器对字符串字段进行索引。
一个数据类型通过fields参数支持多字段。
动态映射
字段和映射类型在使用前不需要事先定义。依靠动态映射,通过索引文档,新的映射类型和字段名会自动添加。新的字段可以添加到顶级映射类型或者映射内部的对象和嵌入字段。
动态映射可以配置自定义映射用于新类型或者新字段。
显示映射
相对于Elasticsearch来说,我们对于数据类型的掌控更加全面,所以我们可以指定显式映射而不是使用动态映射。
当创建索引的时候,可以创建映射类型和字段。也可以在当前的索引中通过映射创建接口添加映射类型和字段。
更新当前映射
除了记录之外,现有的映射类型和字段不能更新。修改映射意味着废弃已经索引的文档,我们反而应该根据映射创建新的索引并且重新索引数据。
映射类型之间共享字段
映射类型在每个索引中是唯一的,就是在一个索引的多个类型中,如果多个类型中的映射名称一样,则它必须是相同的类型。
例如:一个title字段同时存在与user和blogpost映射类型中,title字段在每个类型中必须拥有相同的映射。
这个规则的唯一例外是:对于copy_to参数、dynamic参数、enabled参数、ignore_above参数,include_in_all参数,每个不同映射类型中的字段拥有不同的参数设置。
通常,相同名称的字段由相同类型的数据构成,所以拥有相同的索引是没有问题的。当产生类型冲突的时候,可以选择更详细的命名,比如user_title和blog_title。
映射示例
在创建索引的时候,可以指定映射:
PUT /myindex
{
"mappings": {
"user":{
"_all": {"enabled": false},
"properties":{
"title":{"type":"text"},
"name":{"type":"text"},
"age":{"type":"integer"}
}
},
"blogpost":{
"properties": {
"title":{"type":"text"},
"body":{"type":"text"},
"user_id":{"type":"text","index": false},
"created":{
"type": "date",
"format": "strict_date_optional_time||epoch_millis"
}
}
}
}
}
创建一个名为myindex的索引,在索引中添加名为user和blogpost的映射类型。user类型取消元字段_all,指定了每个映射类型的字段或属性,指定了每个字段的数据类型和映射。