第十章 SQL排序

排序规则指定值的排序和比较方式,并且是InterSystems SQL和InterSystemsIRIS®数据平台对象的一部分。有两种基本排序规则:数字和字符串。

  • 数值排序规则按以下顺序基于完整数字对数字进行排序:null,然后是负数,从最大到最小,零,然后是正数,从最小到最大。这将创建如下序列:–210,–185,–54,–34,-.02、0、1、2、10、17、100、120
  • 字符串归类通过对每个顺序字符进行归类来对字符串进行排序。这将创建以下顺序:null,A,AA,AA,AAA,AAB,AB,B。对于数字,这将创建以下顺序:–.02,–185,–210,–34,–54 ,0、1、10、100、120、17、2

默认的字符串排序规则是SQLUPPER;为每个名称空间设置此默认值。 SQLUPPER排序规则将所有字母都转换为大写(出于排序的目的),并在字符串的开头附加一个空格字符。此转换仅用于整理目的;在InterSystems中,无论所应用的排序规则如何,SQL字符串通常以大写和小写字母显示,并且字符串的长度不包括附加的空格字符。

时间戳记是一个字符串,因此遵循当前的字符串排序规则。但是,由于时间戳是ODBC格式,因此如果指定了前导零,则字符串排序规则与时间顺序相同。

  • 字符串表达式(例如使用标量字符串函数LEFTSUBSTR的表达式)使其结果归类为EXACT
  • 两个文字的任何比较都使用EXACT归类。

可以使用“ObjectScript排序后”运算符来确定两个值的相对排序顺序。

可以按以下方式指定排序规则:

  • 命名空间默认值
  • 表字段/属性定义
  • 索引定义查询
  • SELECT
  • 查询DISTINCTGROUP BY子句
排序类型

排序规则可以在字段/属性的定义或索引的定义中指定为关键字。

可以通过对查询子句中的字段名应用排序规则函数来指定排序规则。
在指定排序函数时必须使用%前缀。

排序规则采用升序的ASCII/Unicode序列,具有以下转换:

  • EXACT - 强制字符串数据区分大小写。
    如果字符串数据包含规范数字格式的值(例如123-.57),则不建议使用。
  • SQLSTRING - 去除末尾的空格(空格、制表符等),并在字符串的开头添加一个前导空格。
    它将任何只包含空格(空格、制表符等)的值作为SQL空字符串进行排序。
    SQLSTRING支持可选的maxlen整数值。
  • SQLUPPER - 将所有字母字符转换为大写,去除末尾的空格(空格、制表符等),然后在字符串的开头添加一个前导空格字符。
    附加这个空格字符的原因是为了强制将数值作为字符串进行整理(因为空格字符不是有效的数字字符)。
    这种转换还导致SQL将SQL空字符串(")值和任何只包含空格(空格、制表符等)的值作为单个空格字符进行整理。
    SQLUPPER支持可选的maxlen整数值。

    注意,SQLUPPER转换与SQL函数UPPER的结果不同。
  • TRUNCATE —增强字符串数据的区分大小写,并且(与EXACT不同)允许指定截断该值的长度。当索引比下标支持的数据长的精确数据时,此功能很有用。它采用%TRUNCATE(string,n)形式的正整数参数将字符串截断为前n个字符,从而改善了对长字符串的索引和排序。如果未为TRUNCATE指定长度,则其行为与EXACT相同;同时支持此行为。如果仅在定义了长度的情况下使用TRUNCATE而在没有定义长度的情况下使用EXACT,则定义和代码可能更易于维护。
  • PLUS —使值成为数字。非数字字符串值将返回0。
  • MINUS — 使数值成为数字并更改其符号。非数字字符串值将返回0。

注意:还有多种传统排序规则类型,不建议使用。

在SQL查询中,可以指定不带括号%SQLUPPER Name或带括号%SQLUPPER(Name)的排序规则函数。如果排序规则函数指定了截断,则必须使用括号%SQLUPPER(Name,10)

三种排序规则类型:SQLSTRINGSQLUPPERTRUNCATE支持可选的maxlen整数值。如果指定,maxlen会将字符串的分析截断为前n个字符。在对长字符串进行索引和排序时,可以使用它来提高性能。可以在查询中使用maxlen进行排序,分组或返回截断的字符串值。

还可以使用 %SYSTEM.Util.Collation()方法执行排序规则类型转换。

命名空间范围的默认排序规则

每个名称空间都有一个当前的字符串排序规则设置。此字符串排序规则是为%Library.String中的数据类型定义的。默认值为SQLUPPER。此默认值可以更改。

可以基于每个命名空间定义排序规则默认值。默认情况下,名称空间没有分配的排序规则,这意味着它们使用SQLUPPER排序规则。可以为命名空间分配其他默认排序规则。此名称空间默认排序规则适用于所有进程,并且在InterSystems上保持不变,IRIS会重新启动,直到明确重置为止。

/// d ##class(PHA.TEST.SQL).Collation()
ClassMethod Collation()
{
	SET stat=$$GetEnvironment^%apiOBJ("collation","%Library.String",.collval)
	WRITE "初始排序 ",$NAMESPACE,!
	ZWRITE collval
SetNamespaceCollation
	DO SetEnvironment^%apiOBJ("collation","%Library.String","SQLstring")
	SET stat=$$GetEnvironment^%apiOBJ("collation","%Library.String",.collnew)
	WRITE "user-assigned排序为 ",$NAMESPACE,!
	ZWRITE collnew
ResetCollationDefault
	DO SetEnvironment^%apiOBJ("collation","%Library.String",.collval)
	SET stat=$$GetEnvironment^%apiOBJ("collation","%Library.String",.collreset)
	WRITE "恢复排序规则的默认值 ",$NAMESPACE,!
	ZWRITE collreset
}

DHC-APP>d ##class(PHA.TEST.SQL).Collation()
初始排序 DHC-APP
user-assigned排序为 DHC-APP
collnew="SQLstring"
恢复排序规则的默认值 DHC-APP

注意,如果从未设置名称空间排序的默认值,那么$$GetEnvironment将返回一个未定义的排序变量,例如本例中的.collval
这个未定义的排序规则默认为SQLUPPER

注意:如果数据包含德语文本,大写排序规则可能不是理想的默认设置。
这是因为德语eszett字符($CHAR(223))只有小写形式。
相当于大写的是两个字母“SS”
转换为大写的SQL排序规则不会转换eszett, eszett保持为单个小写字母不变。

表字段/属性定义排序

在SQL中,排序规则可以分配为字段/属性定义的一部分。字段使用的数据类型确定其默认排序规则。字符串数据类型的默认排序规则为SQLUPPER。非字符串数据类型不支持排序规则分配。

可以在CREATE TABLEALTER TABLE中为字段指定排序规则:

CREATE TABLE Sample.MyNames (
    LastName CHAR(30),
    FirstName CHAR(30) COLLATE SQLstring)

注意:使用CREATE TABLE``和ALTER TABLE为字段指定排序规则时,前缀是可选的:COLLATE SQLstringCOLLATE %SQLstring

在使用持久类定义定义表时,可以为属性指定排序规则:

Class Sample.MyNames Extends %Persistent [DdlAllowed]
{
Property LastName As %String;
Property FirstName As %String(COLLATION = "SQLstring");
}

注意:在为类定义和类方法指定排序规则时,请勿将前缀用于排序规则类型名称。

在这些示例中,LastName字段采用默认排序规则(SQLUPPER,不区分大小写),FirstName字段使用区分大小写的SQLSTRING排序规则进行定义。

如果更改类属性的排序规则,并且已经存储了该类的数据,则该属性上的所有索引都将变为无效。必须基于此属性重建所有索引。

索引定义排序

CREATE INDEX命令无法指定索引排序规则类型。索引使用与要索引的字段相同的排序规则。

定义为类定义一部分的索引可以指定排序规则类型。默认情况下,给定一个或多个给定属性的索引使用属性数据的排序规则类型。例如,假设已定义类型为%String的属性Name

Class MyApp.Person Extends %Persistent [DdlAllowed]
{
Property Name As %String;
Index NameIDX On Name;
}

名称的排序规则为SQLUPPER%String的默认值)。假设“Person”表包含以下数据:

ID Name
1 Jones
2 JOHNSON
3 Smith
4 jones
5 SMITH

然后,Name上的索引将包含以下条目:

Name ID(s)
JOHNSON 2
JONES 1, 4
SMITH 3, 5

SQL引擎可以将此索引直接用于ORDER BY或使用“Name”字段进行比较操作。

可以通过在索引定义中添加一个As子句来覆盖用于索引的默认排序规则:

Class MyApp.Person Extends %Persistent [DdlAllowed]
{
Property Name As %String;
Index NameIDX On Name As SQLstring;
}

在这种情况下,NameIDX索引现在将以SQLSTRING(区分大小写)的形式存储值。使用上面示例中的数据:

Name ID(s)
JOHNSON 2
Jones 1
jones 4
SMITH 5
Smith 3

在这种情况下,对于需要区分大小写排序规则的任何查询,SQL Engine都可以利用此索引。

通常,不必更改索引的排序规则。如果要使用其他排序规则,最好在属性级别定义它,然后让属性上的所有索引都采用正确的排序规则。

如果使用索引属性执行属性比较,则在比较中指定的属性应与相应索引具有相同的排序规则类型。例如,SELECTWHERE子句或JOINON子句中的Name属性应与为Name属性定义的索引具有相同的排序规则。如果属性归类和索引归类之间不匹配,则索引可能无效或根本不使用。

如果将索引定义为使用多个属性,则可以分别指定每个索引的排序规则:

Index MyIDX On (Name As SQLstring, Code As Exact);