什么是SQL的聚集函数,如何利用它们汇总表的数据。

一、聚集函数

我们需要汇总数据而不用把它们实际检索出来,为此SQL提供了专门的函数。使用这些函数,SQL查询可用于检索数据,以便分析和报表生成。这种类型的检索例子有:

• 确定表中行数(或者满足某个条件或包含某个特定值的行数);

• 获得表中某些行的和;

• 找出表列(或所有行或某些特定的行)的最大值、最小值、平均值。

为方便这种类型的检索,SQL给出了5个聚集函数

聚集函数(aggregate function)

对某些行运行的函数,计算并返回一个值。

表9-1 SQL聚集函数

mysql select 两个数相除得百分比_数据库

 

AVG函数

AVG()通过对表中行数计数并计算其列值之和,求得该列的平均值。AVG()可用来返回所有列的平均值,也可以用来返回特定列或行的平均值。

例如:

使用AVG()返回Products表中所有产品的平均价格:

SELECT AVG(prod_price) AS avg_price FROM Products;

此SELECT语句返回值avg_price,它包含Products表中所有产品的平均价格。

 

AVG()也可以用来确定特定列或行的平均值。

例如:

SELECT AVG(prod_price) AS avg_price FROM Products WHERE vend_id = 'DLL01';

这条SELECT语句与前一条的不同之处在于,它包含了WHERE子句。此WHERE子句仅过滤出vend_id为DLL01的产品,因此avg_price中返回的值只是该供应商产品的平均值。

注意:只用于单个列

AVG()只能用来确定特定数值列的平均值,而且列名必须作为函数参数给出。为了获得多个列的平均值,必须使用多个AVG()函数。

说明:NULL值

AVG()函数忽略列值为NULL的行。

COUNT函数

COUNT()函数进行计数。可利用COUNT()确定表中行的数目或符合特定条件的行的数目。

COUNT()函数有两种使用方式:

• 使用COUNT(*)对表中行的数目进行计数,不管表列中包含的是空值(NULL)还是非空值。

• 使用COUNT(column)对特定列中具有值的行进行计数,忽略NULL值。

例如:

返回Customers表中顾客的总数:

SELECT COUNT(*) AS num_cust FROM Customers;

在此例子中,利用COUNT(*)对所有行计数,不管行中各列有什么值。计数值在num_cust中返回。

说明:NULL值

如果指定列名,则COUNT()函数会忽略指定列的值为空的行,但如果COUNT()函数中用的是星号(*),则不忽略。

MAX函数

MAX()返回指定列中的最大值。MAX()要求指定列名。

例如:

SELECT MAX(prod_price) AS max_price FROM Products;

这里,MAX()返回Products表中最贵物品的价格。

提示:对非数值数据使用MAX()

虽然MAX()一般用来找出最大的数值或日期值,但许多(并非所有)DBMS允许将它用来返回任意列中的最大值,包括返回文本列中的最大值。在用于文本数据时,MAX()返回按该列排序后的最后一行。

说明:NULL值

MAX()函数忽略列值为NULL的行。

MIN函数

MIN()的功能正好与MAX()功能相反,它返回指定列的最小值。与MAX()一样,MIN()要求指定列名。

例如:

SELECT MIN(prod_price) AS min_price FROM Products;

其中MIN()返回Products表中最便宜物品的价格。

提示:对非数值数据使用MIN()

虽然MIN()一般用来找出最小的数值或日期值,但许多(并非所有)DBMS允许将它用来返回任意列中的最小值,包括返回文本列中的最小值。在用于文本数据时,MIN()返回该列排序后最前面的行。

说明:NULL值

MIN()函数忽略列值为NULL的行。

SUM函数

SUM()用来返回指定列值的和(总计)。

例如:

OrderItems包含订单中实际的物品,每个物品有相应的数量。可如下检索所订购物品的总数(所有数量值之和):

SELECT SUM(quantity) AS items_ordered FROM OrderItems WHERE order_num = 20005;

函数SUM(quantity)返回订单中所有物品数量之和,WHERE子句保证只统计某个物品订单中的物品。

SUM()也可以用来合计计算值。

例如:

合计每项物品的item_price*quantity,得出总的订单金额:

SELECT SUM(item_price*quantity) AS total_price FROM OrderItems WHERE order_num = 20005;

函数SUM(item_price*quantity)返回订单中所有物品价钱之和,WHERE子句同样保证只统计某个物品订单中的物品。

提示:在多个列上进行计算

如本例所示,利用标准的算术操作符,所有聚集函数都可用来执行多个列上的计算。

说明:NULL值

SUM()函数忽略列值为NULL的行。

 

二、聚集不同值

以上5个聚集函数都可以如下使用:

• 对所有行执行计算,指定ALL参数或不指定参数(因为ALL是默认行为)。

• 只包含不同的值,指定DISTINCT参数。

提示:ALL为默认

ALL参数不需要指定,因为它是默认行为。如果不指定DISTINCT,则假定为ALL。

说明:不要在Access中使用

Microsoft Access在聚集函数中不支持DISTINCT,因此下面的例子不适合于Access。要在Access得到类似的结果,需要使用子查询把DISTINCT数据返回到外部SELECT COUNT(*)语句。

例如:

AVG()函数返回特定供应商提供的产品的平均价格,使用DISTINCT。

SELECT AVG(DISTINCT prod_price) AS avg_price FROM Products WHERE vend_id = 'DLL01';

可以看到,在使用了DISTINCT后,此例子中的avg_price比较高,因为有多个物品具有相同的较低价格。排除它们提升了平均价格。

注意:DISTINCT不能用于COUNT(*)

如果指定列名,则DISTINCT只能用于COUNT()。DISTINCT不能用于COUNT(*)。类似地,DISTINCT必须使用列名,不能用于计算或表达式。

提示:将DISTINCT用于MIN()和MAX()

虽然DISTINCT从技术上可用于MIN()和MAX(),但这样做实际上没有价值。一个列中的最小值和最大值不管是否只考虑不同值,结果都是相同的。

说明:其他聚集参数

除了这里介绍的DISTINCT和ALL参数,有的DBMS还支持其他参数,如支持对查询结果的子集进行计算的TOP和TOP PERCENT。为了解具体的DBMS支持哪些参数,请参阅相应的文档。

 

三、组合聚集函数

实际上,SELECT语句可根据需要包含多个聚集函数。

例如:

SELECT COUNT(*) AS num_items, MIN(prod_price) AS price_min, MAX(prod_price) AS price_max, AVG(prod_price) AS price_avg FROM Products;

这里用单条SELECT语句执行了4个聚集计算,返回4个值(Products表中物品的数目,产品价格的最高值、最低值以及平均值)。

注意:取别名

在指定别名以包含某个聚集函数的结果时,不应该使用表中实际的列名。虽然这样做也算合法,但许多SQL实现不支持,可能会产生模糊的错误消息。