Mysql 8.0新特性(2)

字符集支持

JSON增强

数据类型支持

查询优化器

通用表表达式

Window函数

横向派生表 (Lateral derived tables)

单表DELETE语句中的别名

正则表达式支持

内部临时表

日志记录

备用锁

复写

连接管理

配置

插件

C API

强制类型转换

JSON模式验证

多值索引

Hintable time_zone

Redo日志归档

克隆插件

哈希联接优化

EXPLAIN ANALYZE语句

查询注入(Query cast injection)

TIMESTAMP和DATETIME的时区支持

有关JSON模式CHECK约束失败的精确信息

行和列别名具有ON DUPLICATE KEY UPDATE

SQL标准的显式表子句和表值构造函数

FORCE INDEX,IGNORE INDEX的优化程序提示

JSON_VALUE()函数

用户注释和用户属性

新的optimizer_switch标志

XML的增强

字符集支持

默认字符集从latin1改为utf8mb4。utf8mb4字符集有几个新的排序规则,包括utf8mb4_ja_0900_as_cs,这是第一个适用于MySQL Unicode的日语特定的排序规则。

JSON增强

对MySQL的JSON功能进行了以下增强或添加:

  • 添加了->>(内联路径)运算符,该运算符等效于对JSON_EXTRACT()的结果调用JSON_UNQUOTE()。 这是对MySQL 5.7中引入的列路径运算符->的改进; col->>“ $.path”等效于JSON_UNQUOTE(col->“ $.path”)。 内联路径运算符可在任何可以使用JSON_UNQUOTE(JSON_EXTRACT())的地方使用,例如SELECT列列表,WHERE和HAVING子句以及ORDER BY和GROUP BY子句。 添加了两个JSON聚合函数JSON_ARRAYAGG()和JSON_OBJECTAGG()。 JSON_ARRAYAGG()将列或表达式作为其参数,并将结果聚合为单个JSON数组。 该表达式可以求值为任何MySQL数据类型; 这不必是JSON值。 JSON_OBJECTAGG()接受两列或表达式,将其解释为键和值; 它将结果作为单个JSON对象返回。 添加了JSON实用程序函数JSON_PRETTY(),该函数以易于阅读的格式输出现有的JSON值; 每个JSON对象成员或数组值都打印在单独的一行上,并且子对象或数组相对于其父对象要有2个空格。 此函数还可以与可解析为JSON值的字符串一起使用。
  • 现在,在使用ORDER BY在查询中对JSON值进行排序时,每个值现在都由排序键的可变长度部分表示,而不是由固定大小1K的一部分表示。 在许多情况下,这可以减少过多的使用。 例如,标量INT甚至BIGINT值实际上只需要很少的字节,因此该空间的其余部分(最多90%或更多)被填充占用。 此更改具有以下性能优势: 现在可以更有效地使用排序缓冲区空间,因此文件排序不需要像固定长度排序键那样早或经常刷新到磁盘。 这意味着可以在内存中整理更多数据,避免不必要的磁盘访问。 较短的键可以比较长的键更快地进行比较,从而在性能上有明显的提高。 对于完全在内存中执行的排序以及需要写入磁盘和从磁盘读取的排序,都是如此。
  • 在MySQL 8.0.2中添加了对JSON列值的部分就地更新的支持,这比完全删除现有JSON值并在其位置写入新值的效率要高,就像以前在更新任何JSON列时所做的那样。 为了应用此优化,必须使用JSON_SET(),JSON_REPLACE()或JSON_REMOVE()来应用更新。 无法将新元素添加到要更新的JSON文档中; 文档中的值不能占用比更新前更多的空间。 可以将JSON文档的部分更新写入二进制日志,比记录完整的JSON文档占用更少的空间。 在使用基于语句的复制时,始终会记录部分更新。 为了使其与基于行的复制一起使用,必须首先设置binlog_row_value_options = PARTIAL_JSON;
  • 添加了JSON实用程序功能JSON_STORAGE_SIZE()和JSON_STORAGE_FREE(). JSON_STORAGE_SIZE()以字节为单位返回存储空间,该存储空间用于在进行任何部分更新之前对JSON文档进行二进制表示。 JSON_STORAGE_FREE()显示使用JSON_SET()或JSON_REPLACE()进行部分更新后,JSON类型的表列中剩余的空间量; 如果新值的二进制表示形式小于先前值的二进制表示形式,则该值大于零。 这些函数中的每一个还接受JSON文档的有效字符串表示形式。 对于此值,JSON_STORAGE_SIZE()返回其二进制表示形式转换为JSON文档后使用的空间。 对于包含JSON文档的字符串表示形式的变量,JSON_STORAGE_FREE()返回零。 如果无法将其(非null)参数解析为有效的JSON文档,则任何一个函数都会生成错误;如果参数为NULL,则任何一个函数都将生成NULL。 JSON_STORAGE_SIZE()和JSON_STORAGE_FREE()在MySQL 8.0.2中实现。
  • MySQL 8.0.2中增加了对XPath表达式中的范围,例如$ [1 to 5]的支持。 在此版本中还增加了对last关键字和相对寻址的支持,因此$ [last]总是选择数组中的最后一个(编号最高的)元素,而$ [last-1]则选择最后一个元素的下一个。 last和使用它的表达式也可以包含在范围定义中。 例如,$ [last-2 to last-1]返回最后两个元素,但返回数组中的一个.
  • 添加了旨在符合RFC 7396的JSON合并功能。JSON_MERGE_PATCH()在2个JSON对象上使用时,将它们合并为一个具有以下集合的并集的单个JSON对象: 第一个对象的每个成员,在第二个对象中不存在具有相同键的成员。 第二个对象的每个成员,在第一个对象中没有成员具有相同的键,并且其值不是JSON空文字。 每个成员都具有在两个对象中都存在的键,并且其在第二个对象中的值不是JSON空文字。 作为这项工作的一部分,JSON_MERGE()函数已重命名为JSON_MERGE_PRESERVE()。JSON_MERGE()继续被视为MySQL 8.0中JSON_MERGE_PRESERVE()的别名,但现在已弃用,并且在将来的MySQL版本中会被删除。
  • 实现重复密钥的“last duplicate key wins”规范化,与RFC 7159和大多数JavaScript解析器一致。 此处显示了此行为的示例,其中仅保留了具有键x的最右边的成员:
mysql> SELECT JSON_OBJECT('x', '32', 'y', '[true, false]',
     >                     'x', '"abc"', 'x', '100') AS Result;
+------------------------------------+
| Result                             |
+------------------------------------+
| {"x": "100", "y": "[true, false]"} |
+------------------------------------+
1 row in set (0.00 sec)

插入MySQL JSON列的值也以这种方式标准化

mysql> CREATE TABLE t1 (c1 JSON);

mysql> INSERT INTO t1 VALUES ('{"x": 17, "x": "red", "x": [3, 5, 7]}');

mysql> SELECT c1 FROM t1;
+------------------+
| c1               |
+------------------+
| {"x": [3, 5, 7]} |
+------------------+

与以前的MySQL版本相比,这是一个不兼容的更改,以前的版本在这种情况下使用了“first duplicate key wins”算法。

  • 在MySQL 8.0.4中添加了JSON_TABLE()函数。 此函数接受JSON数据,并将其作为具有指定列的关系表返回。 此函数的语法为JSON_TABLE(expr,path COLUMNS column_list)[AS]别名),其中expr是一个返回JSON数据的表达式,path是应用于源的JSON路径,column_list是列定义的列表。
mysql> SELECT *
    -> FROM
    ->   JSON_TABLE(
    ->     '[{"a":3,"b":"0"},{"a":"3","b":"1"},{"a":2,"b":1},{"a":0},{"b":[1,2]}]',
    ->     "$[*]" COLUMNS(
    ->       rowid FOR ORDINALITY,
    ->
    ->       xa INT EXISTS PATH "$.a",
    ->       xb INT EXISTS PATH "$.b",
    ->
    ->       sa VARCHAR(100) PATH "$.a",
    ->       sb VARCHAR(100) PATH "$.b",
    ->
    ->       ja JSON PATH "$.a",
    ->       jb JSON PATH "$.b"
    ->     )
    ->   ) AS  jt1;
+-------+------+------+------+------+------+--------+
| rowid | xa   | xb   | sa   | sb   | ja   | jb     |
+-------+------+------+------+------+------+--------+
|     1 |    1 |    1 | 3    | 0    | 3    | "0"    |
|     2 |    1 |    1 | 3    | 1    | "3"  | "1"    |
|     3 |    1 |    1 | 2    | 1    | 2    | 1      |
|     4 |    1 |    0 | 0    | NULL | 0    | NULL   |
|     5 |    0 |    1 | NULL | NULL | NULL | [1, 2] |
+-------+------+------+------+------+------+--------+

JSON源表达式可以是产生有效JSON文档的任何表达式,包括JSON文字,表列或返回JSON的函数调用,例如JSON_EXTRACT(t1,data,’$ .post.comments’).

数据类型支持

MySQL现在支持使用表达式作为数据类型规范中的默认值。 这包括使用表达式作为BLOB,TEXT,GEOMETRY和JSON数据类型的默认值,以前根本无法为其分配默认值。

查询优化器

  • MySQL现在支持不可见索引。 优化器根本不会使用不可见的索引,但否则它会正常维护。 默认情况下,索引可见。 不可见的索引可以测试删除索引对查询性能的影响,而无需进行破坏性的更改,如果需要该索引,则必须撤消该更改.
  • MySQL现在支持降序索引:不再忽略索引定义中的DESC,而是导致键值以降序存储。 以前,索引可以以相反的顺序进行扫描,但会降低性能。 降序索引可以按向前顺序进行扫描,这样效率更高。 当最有效的扫描顺序将某些列的升序与其他列的降序混合时,降序索引还使优化程序可以使用多列索引。
  • MySQL现在支持创建索引表达式值而不是列值的功能索引键部分。 功能性关键部分可为无法以其他方式建立索引的值建立索引,例如JSON值.
  • 在MySQL 8.0.14及更高版本中,在准备过程中而不是在优化过程中删除了由常量文字表达式引起的微不足道的WHERE条件。 在过程的早期删除条件可以简化具有琐碎条件的外部联接的查询的联接,例如这种情况:
SELECT * FROM t1 LEFT JOIN t2 ON condition_1 WHERE condition_2 OR 0 = 1

现在,优化器在准备过程中会看到0 = 1始终为false,从而使OR 0 = 1成为多余,然后将其删除,从而保持以下状态:

SELECT * FROM t1 LEFT JOIN t2 ON condition_1 where condition_2

现在,优化器可以将查询重写为内部联接,如下所示:

SELECT * FROM t1 LEFT JOIN t2 WHERE condition_1 AND condition_2
  • 在MySQL 8.0.16和更高版本中,MySQL可以在优化时使用常量折叠来处理列与常量值之间的比较,其中常量超出范围或相对于列的类型在范围边界上,而不是执行 因此对于执行时的每一行。 例如,给定一个表t带有TINYINT UNSIGNED列c,优化器可以将条件诸如WHERE c <256重写为WHERE 1(并完全优化该条件),或WHERE c> = 255重写为WHERE c = 255。
  • 从MySQL 8.0.16开始,与IN子查询一起使用的半联接优化现在也可以应用于EXISTS子查询。 此外,优化器现在在附加到子查询的WHERE条件中对琐碎相关的相等谓词进行解相关,以便可以像对待IN子查询中的表达式一样对待它们。 这适用于EXISTS和IN子查询。
  • 从MySQL 8.0.17开始,服务器在内部将所有不完整的SQL谓词(即,具有WHERE值形式的谓词,其中值是列名或常量表达式,并且不使用比较运算符)重写为WHERE值<> 0。在情境化阶段,因此查询解析器,查询优化器和查询执行程序仅需要使用完整的谓词即可。 此更改的一个明显效果是,对于布尔值,EXPLAIN输出现在显示true和false,而不是1和0。 此更改的另一个效果是,在SQL布尔上下文中对JSON值求值会对JSON整数0进行隐式比较。考虑如下所示创建和填充的表:
mysql> CREATE TABLE test (id INT, col JSON);

mysql> INSERT INTO test VALUES (1, '{"val":true}'), (2, '{"val":false}');

以前,服务器在SQL布尔上下文中进行比较时,尝试将提取的true或false值转换为SQL布尔,如以下使用IS TRUE的查询所示:

mysql> SELECT id, col, col->"$.val" FROM test WHERE col->"$.val" IS TRUE;
+------+---------------+--------------+
| id   | col           | col->"$.val" |
+------+---------------+--------------+
|    1 | {"val": true} | true         |
+------+---------------+--------------+

在MySQL 8.0.17及更高版本中,提取的值与JSON整数0的隐式copmparison导致不同的结果:

mysql> SELECT id, col, col->"$.val" FROM test WHERE col->"$.val" IS TRUE;
+------+----------------+--------------+
| id   | col            | col->"$.val" |
+------+----------------+--------------+
|    1 | {"val": true}  | true         |
|    2 | {"val": false} | false        |
+------+----------------+--------------+

从MySQL 8.0.21开始,可以在执行测试之前对提取的值使用JSON_VALUE()进行类型转换,如下所示:

mysql> SELECT id, col, col->"$.val" FROM test
    ->     WHERE JSON_VALUE(col, "$.val" RETURNING UNSIGNED) IS TRUE;
+------+---------------+--------------+
| id   | col           | col->"$.val" |
+------+---------------+--------------+
|    1 | {"val": true} | true         |
+------+---------------+--------------+

同样从MySQL 8.0.21开始,服务器提供警告。在SQL布尔上下文中评估JSON值会对JSON整数0进行隐式比较。 如果这不是您想要的,则以这种方式在SQL布尔上下文中比较提取的值时,请考虑使用JSON_VALUE RETURNING将JSON转换为SQL数字类型。

  • 在MySQL 8.0.17和更高版本中,具有NOT IN(子查询)或NOT EXISTS(子查询)的WHERE条件在内部转换为反联接.(一个反联接返回表中没有与联接条件相匹配的行的表中的所有行,并且符合联接条件.)这将删除子查询,因为该子查询的表现在在顶部处理,因此可以更快地执行查询 这类似于并重用现有的用于外部联接的IS NULL优化.
  • 从MySQL 8.0.21开始,单表UPDATE或DELETE语句现在可以在许多情况下利用半联接转换或子查询实现。 这适用于此处显示的形式的语句:
  • UPDATE t1 SET t1.a=value WHERE t1.a IN (SELECT t2.a FROM t2)
  • ELETE FROM t1 WHERE t1.a IN (SELECT t2.a FROM t2) 可以为满足以下条件的单表UPDATE或DELETE完成此操作:
  • UPDATE或DELETE语句使用具有[NOT] IN或[NOT] EXISTS谓词的子查询。
  • 该语句没有ORDER BY子句,也没有LIMIT子句。 (UPDATE和DELETE的多表版本不支持ORDER BY或LIMIT.)
  • 目标表不支持写前读取删除(仅与NDB表相关)。
  • 基于子查询中包含的任何提示以及optimizer_switch的值,允许半联接或子查询实现。 当将半联接优化用于合格的单表DELETE或UPDATE时,这在优化程序跟踪中可见:对于多表语句,跟踪中没有join_optimization对象,而对于单表语句则没有。 该转换在EXPLAIN FORMAT = TREE或EXPLAIN ANALYZE的输出中也可见; 单表语句显示<不可由迭代器执行程序执行”,而多表语句报告完整计划。 Alo从MySQL 8.0.21开始,使用InnoDB表的多表UPDATE语句支持半一致性读取,因为事务隔离级别比REPEATABLE READ弱。

通用表表达式

MySQL现在支持非递归和递归的通用表表达式。 通过允许在SELECT语句和某些其他语句之前使用WITH子句,可以使用公用表表达式来使用命名的临时结果集。 从MySQL 8.0.19开始,递归公用表表达式(CTE)的递归SELECT部分支持LIMIT子句。 还支持LIMIT和OFFSET。

Window函数

MySQL现在支持窗口函数,对于查询的每一行,都使用与该行相关的行来执行计算。 这些包括诸如RANK(),LAG()和NTILE()之类的函数。 此外,现在可以将几个现有的聚合函数用作窗口函数(例如SUM()和AVG())。

横向派生表 (Lateral derived tables)

现在,派生表之前可以使用LATERAL关键字,以指定允许它引用(取决于)同一FROM子句中先前表的列。 横向派生表使某些SQL操作可能无法通过非横向派生表完成,或者需要效率较低的解决方法。

单表DELETE语句中的别名

在MySQL 8.0.16和更高版本中,单表DELETE语句支持使用表别名

正则表达式支持

以前,MySQL使用Henry Spencer正则表达式库来支持正则表达式运算符(REGEXP,RLIKE)。 使用Unicode国际组件(ICU)重新实现了对正则表达式的支持,该组件提供了完整的Unicode支持并且是多字节安全的。 REGEXP_LIKE()函数以REGEXP和RLIKE运算符的方式执行正则表达式匹配,它们现在是该函数的同义词。 此外,REGEXP_INSTR(),REGEXP_REPLACE()和REGEXP_SUBSTR()函数可用于查找匹配位置并分别执行子串替换和提取。 regexp_stack_limit和regexp_time_limit系统变量可控制匹配引擎对资源消耗的控制。

内部临时表

TempTable存储引擎取代了MEMORY存储引擎,成为内存内部临时表的默认引擎。 TempTable存储引擎为VARCHAR和VARBINARY列提供有效的存储。 internal_tmp_mem_storage_engine会话变量定义了内存内部临时表的存储引擎。 允许的值为TempTable(默认值)和MEMORY。 temptable_max_ram变量定义在将数据存储到磁盘之前TempTable存储引擎可以使用的最大内存量。

日志记录

错误日志已重写为使用MySQL组件体系结构。 传统的错误日志记录是使用内置组件实现的,而使用系统日志的日志记录则是可加载的组件。 此外,还提供了可加载的JSON日志编写器。 要控制要启用的日志组件,请使用log_error_services系统变量。

备用锁

一种新型的备份锁允许在联机备份期间使用DML,同时防止可能导致快照不一致的操作。 LOCK INSTANCE FOR BACKUP和UNLOCK INSTANCE语法支持新的备份锁定。 使用这些语句需要BACKUP_ADMIN特权.

复写

MySQL复制现在支持使用紧凑的二进制格式对JSON文档的部分更新进行二进制日志记录,从而在记录完整的JSON文档时节省了日志空间。 当使用基于语句的日志记录时,这种紧凑的日志记录会自动完成,并且可以通过将新的binlog_row_value_options系统变量设置为PARTIAL_JSON来启用。

连接管理

MySQL服务器现在允许专门为管理连接配置TCP / IP端口。 这提供了用于普通连接的网络接口上允许的单个管理连接的替代方法,即使已建立max_connections连接也是如此。 MySQL现在提供了对压缩使用的更多控制,以最大程度地减少通过与服务器的连接发送的字节数。 以前,给定连接未压缩或使用zlib压缩算法。 现在,也可以使用zstd算法,并为zstd连接选择压缩级别。 可以在服务器端以及连接原始端配置允许的压缩算法,以通过客户端程序以及参与主/从复制或组复制的服务器进行连接.

配置

在整个MySQL中,主机名的最大允许长度已增加到255个ASCII字符,之前的限制是60个字符。 例如,这适用于数据字典中与主机名相关的列,mysql系统架构,性能架构,INFORMATION_SCHEMA和sys架构; CHANGE MASTER TO语句的MASTER_HOST值; SHOW PROCESSLIST语句输出中的Host列; 帐户名中的主机名(例如帐户管理语句和DEFINER属性中使用的主机名); 以及与主机名相关的命令选项和系统变量。

  • 允许的主机名长度增加会影响在主机名列上具有索引的表。 例如,mysql系统模式中索引主机名的表现在具有DYNAMIC的显式ROW_FORMAT属性,以容纳更长的索引值。
  • 某些基于文件名的配置设置可能是基于服务器主机名构造的。 允许的值受基础操作系统的约束,该操作系统可能不允许文件名足够长以包含255个字符的主机名。 这会影响general_log_file,log_error,pid_file,relay_log和slow_query_log_file系统变量以及相应的选项。 如果基于主机名的值对于OS而言太长,则必须提供明确的较短值。
  • 尽管服务器现在支持255个字符的主机名,但使用–ssl-mode = VERIFY_IDENTITY选项建立的服务器连接受到OpenSSL支持的最大主机名长度的限制。 主机名匹配与SSL证书的两个字段有关,它们的最大长度如下:公用名:最大长度64;默认值:64。 主题备用名称:根据RFC#1034的最大长度。

插件

以前,MySQL插件可以用C或C ++编写。 插件使用的MySQL头文件现在包含C ++代码,这意味着插件必须用C ++而不是C编写。

C API

MySQL C API现在支持异步功能,用于与MySQL服务器的非阻塞通信。 每个功能都是现有同步功能的异步对应项。 如果从服务器连接读取或写入服务器连接,则必须等待同步功能。 异步功能使应用程序可以检查服务器连接上的工作是否准备就绪。 如果不是,应用程序可以执行其他工作,然后再进行检查。

强制类型转换

函数CAST()和CONVERT()现在支持转换为DOUBLE,FLOAT和REAL类型。

JSON模式验证

MySQL 8.0.17添加了两个函数JSON_SCHEMA_VALID()和JSON_SCHEMA_VALIDATION_REPORT()来再次验证JSON文档JSON模式。 如果文档根据模式进行验证,则JSON_SCHEMA_VALID()返回TRUE,否则通过FALSE返回。 JSON_SCHEMA_VALIDATION_REPORT()返回一个JSON文档,其中包含有关验证结果的详细信息。 以下语句适用于这两个功能:

  • 模式必须符合JSON模式规范的草案4。
  • 支持必需的属性。
  • 不支持外部资源和$ ref关键字。
  • 支持正则表达式模式; 无效模式将被静默忽略。

多值索引

从MySQL 8.0.17开始,InnoDB支持创建多值索引,这是在JSON列上定义的辅助索引,该索引存储值数组,并且可以为一个数据记录包含多个索引记录。 这样的索引使用关键部分定义,例如CAST(data->’$.zipcode’ AS UNSIGNED ARRAY)。 MySQL优化器会自动将多值索引用于合适的查询,如可在EXPLAIN的输出中查看的那样。

Hintable time_zone

使用SET_VAR可以提示time_zone会话变量。

Redo日志归档

从MySQL 8.0.17开始,InnoDB支持重做日志归档。 在执行备份操作时,复制重做日志记录的备份实用程序有时可能无法跟上重做日志生成的步伐,由于这些记录被覆盖,导致丢失重做日志记录。 重做日志归档功能通过将重做日志记录顺序写入存档文件来解决此问题。 备份实用程序可以根据需要从存档文件复制重做日志记录,从而避免潜在的数据丢失.

克隆插件

从MySQL 8.0.17开始,MySQL提供了一个克隆插件,该插件允许在本地或从远程MySQL服务器实例克隆InnoDB数据。 本地克隆操作将克隆的数据存储在运行MySQL实例的同一服务器或节点上。 远程克隆操作通过网络将克隆的数据从施主MySQL服务器实例传输到发起克隆操作的接收者服务器或节点。 克隆插件支持复制。 除了克隆数据之外,克隆操作还从施主提取并传输复制坐标,并将其应用于接收者,从而可以使用克隆插件来配置组复制成员和复制从属。 与复制大量事务相比,使用克隆插件进行配置要快得多,效率也更高。 还可以将组复制成员配置为使用克隆插件作为替代的恢复方法,以便成员自动选择从种子成员中检索组数据的最有效方法。

哈希联接优化

从MySQL 8.0.18开始,只要联接中的每对表都包含至少一个等联接条件,就使用哈希联接。 哈希联接不需要索引,并且在大多数情况下比块嵌套循环算法更有效。 可以通过这种方式优化此处所示的联接:

SELECT *
    FROM t1
    JOIN t2
        ON t1.c1=t2.c1;

SELECT *
    FROM t1
    JOIN t2
        ON (t1.c1 = t2.c1 AND t1.c2 < t2.c2)
    JOIN t3
        ON (t2.c1 = t3.c1)

哈希联接还可以用于笛卡尔积-即未指定联接条件时.

EXPLAIN ANALYZE语句

MySQL 8.0.18中实现了EXPLAIN语句的新形式EXPLAIN ANALYZE,它为处理查询所使用的每个迭代器提供了有关TREE格式SELECT语句执行的扩展信息,并使得可以将估算的成本与 查询的实际费用。 该信息包括启动成本,总成本,此迭代器返回的行数以及执行的循环数。

在MySQL 8.0.21和更高版本中,此语句还支持FORMAT = TREE说明符。 TREE是唯一受支持的格式。

查询注入(Query cast injection)

在8.0.18及更高版本中,MySQL将强制转换操作注入表达式和条件内的查询项树中,在该表达式和条件中,参数的数据类型与预期的数据类型不匹配。 这对查询结果或执行速度没有影响,但是使查询的执行等同于符合SQL标准的查询,同时保持了与早期MySQL版本的向后兼容性。 现在,只要比较它们,就可以在时间类型(DATE,DATETIME,TIMESTAMP,TIME)和数字类型(SMALLINT,TINYINT,MEDIUMINT,INT / INTEGER,BIGINT,DECIMAL / NUMERIC,FLOAT,DOUBLE,REAL,BIT等)之间执行此类隐式转换 使用任何标准数字比较运算符(=,> =,>,<,<=,<> /!=或<=>)。 在这种情况下,任何尚未为DOUBLE的值都将强制转换为1。 现在还可以执行强制转换注入,以比较DATE或TIME值与DATETIME值,其中在必要时将参数强制转换为DATETIME。 从MySQL 8.0.21开始,在将字符串类型与其他类型进行比较时,也会执行此类转换。 强制转换的字符串类型包括CHAR,VARCHAR,BINARY,VARBINARY,BLOB,TEXT,ENUM和SET。 将字符串类型的值与数字类型或YEAR进行比较时,字符串类型转换为DOUBLE; 如果另一个参数的类型不是FLOAT,DOUBLE或REAL,则还将其强制转换为DOUBLE。 当将字符串类型与DATETIME或TIMESTAMP值进行比较时,将字符串强制转换为DATETIME。 将字符串类型与DATE比较时,该字符串将转换为DATE。 通过查看EXPLAIN ANALYZE,EXPLAIN FORMAT = JSON或如下所示的EXPLAIN FORMAT = TREE的输出,可以查看何时将强制转换注入给定查询:

mysql> CREATE TABLE d (dt DATETIME, d DATE, t TIME);
Query OK, 0 rows affected (0.62 sec)

mysql> CREATE TABLE n (i INT, d DECIMAL, f FLOAT, dc DECIMAL);
Query OK, 0 rows affected (0.51 sec)

mysql> CREATE TABLE s (c CHAR(25), vc VARCHAR(25),
    ->     bn BINARY(50), vb VARBINARY(50), b BLOB, t TEXT,
    ->     e ENUM('a', 'b', 'c'), se SET('x' ,'y', 'z'));
Query OK, 0 rows affected (0.50 sec)

mysql> EXPLAIN FORMAT=TREE SELECT * from d JOIN n ON d.dt = n.i\G
*************************** 1. row ***************************
EXPLAIN: -> Inner hash join (cast(d.dt as double) = cast(n.i as double))
(cost=0.70 rows=1)
    -> Table scan on n  (cost=0.35 rows=1)
    -> Hash
        -> Table scan on d  (cost=0.35 rows=1)

mysql> EXPLAIN FORMAT=TREE SELECT * from s JOIN d ON d.dt = s.c\G
*************************** 1. row ***************************
EXPLAIN: -> Inner hash join (d.dt = cast(s.c as datetime(6)))  (cost=0.72 rows=1)
    -> Table scan on d  (cost=0.37 rows=1)
    -> Hash
        -> Table scan on s  (cost=0.35 rows=1)

1 row in set (0.01 sec)

mysql> EXPLAIN FORMAT=TREE SELECT * from n JOIN s ON n.d = s.c\G
*************************** 1. row ***************************
EXPLAIN: -> Inner hash join (cast(n.d as double) = cast(s.c as double))  (cost=0.70 rows=1)
    -> Table scan on s  (cost=0.35 rows=1)
    -> Hash
        -> Table scan on n  (cost=0.35 rows=1)

1 row in set (0.00 sec)

也可以通过执行EXPLAIN [FORMAT = TRADITIONAL]来看到这种强制类型转换,在这种情况下,还必须在执行EXPLAIN语句后发出SHOW WARNINGS。

TIMESTAMP和DATETIME的时区支持

从MySQL 8.0.19开始,服务器接受带有插入的datetime(TIMESTAMP和DATETIME)值的时区偏移量。 该偏移量使用与设置time_zone系统变量时使用的格式相同的格式,不同之处在于,当偏移量的小时部分小于10且不允许“ -00:00”时,前导零是必需的。 包含时区偏移量的datetime文字的示例为’2019-12-11 10:40:30-05:00’,‘2003-04-14 03:30:00 + 10:00’和’2020-01- 01 15:35:45 + 05:30’。 选择日期时间值时不显示时区偏移量。 包含时区偏移量的Datetime文字可用作准备好的语句参数值。 作为这项工作的一部分,用于设置time_zone系统变量的值现在也被限制在-14:00到+14:00之间(包括该值)。 (如果已加载MySQL时区表,仍然可以为time_zone分配名称值,例如’EST’,'Posix / Australia / Brisbane’和’Europe / Stockholm’到此变量;

有关JSON模式CHECK约束失败的精确信息

使用JSON_SCHEMA_VALID()指定CHECK约束时,MySQL 8.0.19及更高版本会提供有关此类约束失败原因的精确信息。

行和列别名具有ON DUPLICATE KEY UPDATE

从MySQL 8.0.19开始,可以使用别名引用要插入的行,以及(可选)引用其列。 考虑在表t上具有a和b列的以下INSERT语句:

INSERT INTO t SET a=9,b=5
    ON DUPLICATE KEY UPDATE a=VALUES(a)+VALUES(b);

对新行使用别名new,在某些情况下,对于该行的列使用别名m和n,可以用许多不同的方式来重写INSERT语句,此处显示了一些示例:

INSERT INTO t SET a=9,b=5 AS new
    ON DUPLICATE KEY UPDATE a=new.a+new.b;

INSERT INTO t VALUES(9,5) AS new
    ON DUPLICATE KEY UPDATE a=new.a+new.b;

INSERT INTO t SET a=9,b=5 AS new(m,n)
    ON DUPLICATE KEY UPDATE a=m+n;

INSERT INTO t VALUES(9,5) AS new(m,n)
    ON DUPLICATE KEY UPDATE a=m+n;

SQL标准的显式表子句和表值构造函数

根据SQL标准添加了表值构造函数和显式表子句。 这些分别在MySQL 8.0.19中实现为TABLE语句和VALUES语句。

FORCE INDEX,IGNORE INDEX的优化程序提示

MySQL 8.0引入了索引级优化器提示,这些提示类似于第8.9.4节“索引提示”中所述的传统索引提示。 此处列出了新的提示以及它们的FORCE INDEX或IGNORE INDEX等效项:

  • GROUP_INDEX:等同于FORCE INDEX FOR GROUP BY
  • NO_GROUP_INDEX:等同于GROUP BY的IGNORE INDEX
  • JOIN_INDEX:相当于FORCE INDEX FOR JOIN
  • NO_JOIN_INDEX:等同于IGNORE INDEX FOR JOIN
  • ORDER_INDEX:等同于FORCE INDEX FOR ORDER BY
  • NO_ORDER_INDEX:等同于IGNORE INDEX FOR ORDER BY
  • INDEX:与GROUP_INDEX加上JOIN_INDEX加上ORDER_INDEX相同; 等效于没有修饰符的FORCE INDEX
  • NO_INDEX:与NO_GROUP_INDEX加上NO_JOIN_INDEX加上- NO_ORDER_INDEX相同; 等效于IGNORE INDEX,不带修饰符
SELECT a FROM t1 FORCE INDEX (i_a) FOR JOIN WHERE a=1 AND b=2;

SELECT /*+ JOIN_INDEX(t1 i_a) */ a FROM t1 WHERE a=1 AND b=2;

JSON_VALUE()函数

MySQL 8.0.21实现了一个新功能JSON_VALUE(),旨在简化JSON列的索引编制。 在最基本的形式中,它将JSON文档和指向该文档中单个值的JSON路径作为参数,以及(可选)允许您使用RETURNING关键字指定返回类型。 JSON_VALUE(json_doc,路径RETURNING类型)等效于此:

CAST(
    JSON_UNQUOTE( JSON_EXTRACT(json_doc, path) )
    AS type
);

您还可以指定ON EMPTY,ON ERROR或两个子句,类似于JSON_TABLE()所使用的子句。 您可以使用JSON_VALUE()在JSON列上的表达式上创建索引,如下所示:

CREATE TABLE t1(
    j JSON,
    INDEX i1 ( (JSON_VALUE(j, '$.id' RETURNING UNSIGNED)) )
);

INSERT INTO t1 VALUES ROW('{"id": "123", "name": "shoes", "price": "49.95"}');

使用此表达式的查询(例如此处所示)可以使用索引:

SELECT name, price FROM t1
    WHERE JSON_VALUE(j, '$.id' RETURNING UNSIGNED) = 123;

用户注释和用户属性

MySQL 8.0.21引入了在创建或更新用户帐户时设置用户注释和用户属性的功能。 用户注释由任意文本组成,这些文本作为参数传递给与CREATE USER或ALTER USER语句一起使用的COMMENT子句。 用户属性由JSON对象形式的数据组成,这些数据作为参数传递给与这两个语句之一一起使用的ATTRIBUTE子句。 该属性可以包含JSON对象表示法中的任何有效键值对。 在单个CREATE USER或ALTER USER语句中只能使用COMMENT或ATTRIBUTE中的一个。

新的optimizer_switch标志

MySQL 8.0.21为optimizer_switch系统变量添加了两个新标志,如下表所示:

  • prefer_ordering_index flag 默认情况下,只要优化器确定这将导致更快的执行速度,MySQL就会尝试对具有LIMIT子句的任何ORDER BY或GROUP BY查询使用有序索引。 因为在某些情况下为这样的查询选择不同的优化实际上可能会执行得更好,所以现在可以通过将preferred_ordering_index标志设置为off来禁用此优化。 此标志的默认值是on。
  • subquery_to_derived flag 当此标志设置为on时,优化程序将合格的标量子查询转换为派生表上的联接。 例如,查询SELECT * FROM t1 WHERE t1.a>(SELECT COUNT(a)FROM t2)被重写为SELECT t1.a FROM t1 JOIN(SELECT COUNT(t2.a)AS c FROM t2)AS d WHERE t1 .a>d.c

XML的增强

从MySQL 8.0.21开始,LOAD XML语句现在支持要导入的XML中的CDATA节。