耐心阅读,会有收获的


〇. 从创建索引的要素说起

提示:数据版本:MySQL 8 +

首先需要知道,创建json数据字段的索引和普通字段的索引,在本质上没有区别。

为什么没什么区别?我们思考一下,创建一个索引的要素有哪些?我们需要提供什么信息?

  1. 表名,即要知道你要操作哪张表。
  2. 待创建索引的字段,毕竟索引是根据一个或多个字段来创建的。
  3. 待创建索引字段的数据类型。
  4. 待创建的索引名称, 需要唯一。

普通数据类型的字段, 如:int, char, unsigned等,我们很好提供上面的信息,例如:为student表的name CHAR(32)字段创建一个索引,语句为:【ALTER TABLE student ADD INDEX student_name_index(name);】,该语句中,student提供了1. 表名, name同时提供2. 待创建索引的字段,即student.name3.待创建索引字段的数据类型, 即CHAR(32)两种信息,student_name_index提供了4. 待创建的索引名称。拥有了这4个信息,我们可成功创建索引。

但可惜的是,MySQL不支持直接json数据类型创建索引,因此无法成功执行 【ALTER TABLE student ADD INDEX student_name_index(json_field_name);】。

因此,MySQL8引入了间接创建的方式。也就是,可以间接指定json数据的成员或者元素作为创建索引的字段,而字段对应的数据类型我们手动指定。

换句话说,就是为json数据的成员,提供2. 待创建索引的字段3.待创建索引字段的数据类型两种信息,从而拥有创建索引的4要素, 即可创建索引。因此,创建的语句区别,为标【有所区别,需要做改动的地方】的地方,
ALTER TABLE student ADD INDEX student_name_index(【有所区别,需要做改动的地方】);】,而本质上没有任何区别。

接下来将围绕着这一个区别 进行细致的讲解。

一. 创建索引

由于json有两类不同的数据形式,即:json对象(如:{"id": 1, "name":"he"}),json数组(如:["1","2","3"]),因为进行分开讲解。

1. 当字段的数据为json对象

例如:有student表,拥有一个json类型的字段data,数据形如:{"id": 1, "name":"he"}

【内容】为需要自行替换的部分

语法:ALTER Table 【表名】 ADD INDEX 索引名( ( CAST(【表中json的字段名】-> "$.【需要建立索引的数据成员名】" as【需要建立索引的数据成员的数据类型】 ARRAY) ) )

其中,【成员名对应的数据类型】自行参考数据MySQL8拥有的数据类型,例如可填:CHAR(32), UNSIGNED等。

1.1 示例:为data字段数据中的name成员创建索引。

创建索引语句:ALTER Table student ADD INDEX student_name_index( ( CAST( data -> “$.name” as CHAR(32) ARRAY) );

2. 当数据为json数组

例如: 例如:有student表,拥有一个json类型的字段data,数据形如:["1","2"][{"id": 1, "name":"he"},{"id": 2, "name":"zhi"}]

【内容】为需要自行替换的部分

语法:ALTER Table 【表名】 ADD INDEX 索引名( ( CAST(【表中json的字段名】 -> '$[*].【需要作为索引的json数据的成员名】' as 【成员名对应的数据类型】‘ ARRAY) ) )

其中, $[*]代表数据中的每个元素,也就是将会让所有的元素加入索引,例如:第x行的数据为["1","2"],索引中将有"1""2"都对应到x行;若为$[0],那么只会将每行的第一个元素加入索引。

此外,【成员名对应的数据类型】自行参考数据mysql拥有的数据类型,例如:CHAR(32), UNSIGNED等。

2.1 示例:当data字段数据为["1","2"],为数组中所有元素创建索引。

创建索引语句:ALTER Table student ADD INDEX student_data_index( ( CAST( data -> “$[*]” as CHAR(32) ARRAY) );

2.2 示例:当data字段数据为[{"id": 1, "name":"he"},{"id": 2, "name":"zhi"}],为数组中所有元素的成员id创建索引。

创建索引语句:ALTER Table student ADD INDEX student_data_index( ( CAST( data -> “$[*].id” as UNSIGNED ARRAY) );

3. 当数据为json数组,但内部元素不为json对象

例如:["1","2", "3"]就是为json数组,但内部元素不为json对象的数据,使用上述的1.2.的语法都可,推荐使用2.语义更为明确。下方的示例,展示这种特殊的情况。

二. 完整示例(内部元素不为json对象json数组

1. 表定义和数据准备

-- 创建表
DROP TABLE IF EXISTS `test`;
CREATE TABLE test ( 
	id BIGINT NOT NULL AUTO_INCREMENT PRIMARY KEY, 
    jchararr JSON NOT NULL COMMENT "元素为char类型的json数组"
);

-- 插入数据
INSERT INTO 
    test (jchararr) 
VALUES 
    ('["1","2","3"]'),
    ('["1"]'),
    ('[]'),
    ('["4","2","3"]');

2. 为jchararr 字段中的每个元素创建索引

接下来将展示两种不同的方式。

2.1 方式1

2.1.1 创建索引

ALTER Table test ADD INDEX jchararr_index(
     /* 由于数组中的元素类型,sql不知道,需要手动指定数组中的元素的类型为Char*/
    ( CAST(`jchararr` as CHAR(32) ARRAY) )
);

2.1.2 触发索引的查询方式

SELECT * FROM test WHERE '2' MEMBER OF(jchararr);

2.2.3 性能分析

EXPLAIN SELECT * FROM test WHERE '2' MEMBER OF(jchararr);

运行结果:

mysql json格式最大 mysql8 json类型_数据库

2.1.4 【方式1】的局限性

只适用于当字段的数据为[1,2,3,4,4]或者['a','b','c']的json数组,而若是[{"id": 1},{"d": 2'}]这样的数据,需创建id的索引,并不支持,因为仅通过CAST(jchararr as CHAR(32) ARRAY)是无法让mysql知道[{"id": 1},{"d": 2'}]中有id这个成员和它的数据类型。当然方式2可以通过$[*].member_namejson内部成员访问符,进行指定,从而解决该问题。

2.2 方式2

2.2.1 创建语句

ALTER Table test ADD INDEX jchararr_index_2(
     /* 由于数组中的元素类型,sql不知道,需要手动指定数组中的元素的类型为Char*/
    ( CAST(`jchararr`->'$[*]' as CHAR(32) ARRAY) )
);

上述的$[*]'代表json数组中的所有元素,若元素类型为json对象,如:[{"id": 1},{"d": 2'}],则需改成$[*].id

2.2.2 触发索引的查询方式

SELECT * FROM test WHERE '2' MEMBER OF(jchararr->'$[*]');

上述的$[*]'代表json数组中的所有元素,若元素类型为json对象,如:[{"id": 1},{"d": 2'}],则需改成$[*].id

2.2.3 性能分析

EXPLAIN SELECT * FROM test WHERE '2' MEMBER OF(jchararr->'$[*]');

运行结果:

mysql json格式最大 mysql8 json类型_数据库_02

花了一整天写的文章,如果对你有帮助,希望能够点赞收藏一下,谢谢支持。