12.1 聚集函数
聚集函数( aggregate function) 运行在行组上,计算和返回单个值的函数。
函 数 | 说 明 |
AVG() | 返回某列的平均值 |
COUNT() | 返回某列的行数 |
MAX() | 返回某列的最大值 |
MIN() | 返回某列的最小值 |
SUM() | 返回某列值之和 |
12.1.1 AVG()函数
AVG()
通过对表中行数计数并计算特定列值之和,求得该列的平均值。 AVG()
可用来返回所有列的平均值,也可以用来返回特定列或行的平均值。下面的例子使用AVG()返回products表中所有产品的平均价格:
mysql> SELECT AVG(prod_price) AS avg_price FROM products;
+-----------+
| avg_price |
+-----------+
| 16.133571 |
+-----------+
- 分析:此SELECT语句返回值
avg_price
,它包含products
表中所有产品的平均价格。
mysql> SELECT AVG(prod_price) AS avg_price FROM products WHERE vend_id = 1003;
+-----------+
| avg_price |
+-----------+
| 13.212857 |
+-----------+
- 分析:这条
SELECT
语句与前一条的不同之处在于它包含了WHERE
子句。此WHERE
子句仅过滤出vend_id
为1003
的产品,因此avg_price
中返回的值只是该供应商的产品的平均值。
只用于单个列 AVG():只能用来确定特定数值列的平均值,而且列名必须作为函数参数给出。为了获得多个列的平均值,必须使用多个AVG()函数。
NULL值:AVG()函数忽略列值为NULL的行。
12.1.2 COUNT()函数
COUNT()
函数进行计数。 可利用COUNT()
确定表中行的数目或符合特定条件的行的数目。COUNT()
函数有两种使用方式。
- 使用
COUNT(*)
对表中行的数目进行计数, 不管表列中包含的是空
值( NULL)
还是非空值。 - 使用
COUNT(column)
对特定列中具有值的行进行计数,忽略NULL
值。
下面的例子返回customers
表中客户的总数:
mysql> SELECT COUNT(*) AS num_cust FROM customers;
+----------+
| num_cust |
+----------+
| 5 |
+----------+
- 分析:在此例子中,利用
COUNT(*)
对所有行计数,不管行中各列有什么值。计数值在num_cust
中返回。
下面的例子只对具有电子邮件地址的客户计数:
mysql> SELECT COUNT(cust_email) AS num_cust FROM customers;
+----------+
| num_cust |
+----------+
| 3 |
+----------+
- 分析:这条
SELECT
语句使用COUNT(cust_email)
对cust_email
列中有值的行进行计数。 在此例子中,cust_email
的计数为3(表示5个客户中只有3个客户有电子邮件地址)。
NULL值:如果指定列名,则指定列的值为空的行被
COUNT()
函数忽略,但如果COUNT()
函数中用的是星号( *)
,则不忽略。
12.1.3 MAX()函数
MAX()
返回指定列中的最大值。 MAX()
要求指定列名,如下所示:
mysql> SELECT MAX(prod_price) AS max_price FROM products;
+-----------+
| max_price |
+-----------+
| 55.00 |
+-----------+
- 分析:这里,
MAX()
返回products
表中最贵的物品的价格。
对非数值数据使用MAX():虽然
MAX()
一般用来找出最大的数值或日期值,但MySQL允许将它用来返回任意列中的最大值,包括返回文本列中的最大值。在用于文本数据时,如果数据按相应的列排序,则MAX()
返回最后一行。
NULL值:MAX()
函数忽略列值为NULL的行。
12.1.4 MIN()函数
MIN()
的功能正好与MAX()
功能相反,它返回指定列的最小值。与MAX()
一样, MIN()
要求指定列名,如下所示:
mysql> SELECT MIN(prod_price) AS min_price FROM products;
+-----------+
| min_price |
+-----------+
| 2.50 |
+-----------+
- 分析:其中
MIN()
返回products表中最便宜物品的价格。
12.1.5 SUM()函数
SUM()
用来返回指定列值的和(总计)。
下面举一个例子, orderitems表包含订单中实际的物品,每个物品有相应的数量( quantity) 。可如下检索所订购物品的总数(所有quantity值之和):
mysql> SELECT SUM(quantity) AS items_ordered FROM orderitems WHERE order_num = 20005;
+---------------+
| items_ordered |
+---------------+
| 19 |
+---------------+
- 分析:函数
SUM(quantity)
返回订单中所有物品数量之和,WHERE
子句保证只统计某个物品订单中的物品。
SUM()
也可以用来合计计算值。在下面的例子中,合计每项物品的item_price*quantity
,得出总的订单金额:
mysql> SELECT SUM(item_price*quantity) AS total_price FROM orderitems WHERE order_num = 20005;
+-------------+
| total_price |
+-------------+
| 149.87 |
+-------------+
- 分析:函数
SUM(item_price*quantity)
返回订单中所有物品价钱之和,WHERE
子句同样保证只统计某个物品订单中的物品。
在多个列上进行计算:如本例所示,利用标准的算术操作符,所有聚集函数都可用来执行多个列上的计算。
NULL值:SUM()函数忽略列值为NULL的行。
12.2 聚集不同值
以上5个聚集函数都可以如下使用:
- 对所有的行执行计算,指定
ALL
参数或不给参数(因为ALL
是默认行为); - 只包含不同的值,指定
DISTINCT
参数。
ALL为默认:ALL参数不需要指定,因为它是默认行为。如果不指定DISTINCT,则假定为ALL。
下面的例子使用AVG()
函数返回特定供应商提供的产品的平均价格。它与上面的SELECT
语句相同,但使用了DISTINCT
参数,因此平均值只考虑各个不同的价格:
mysql> SELECT AVG(DISTINCT prod_price) AS avg_price FROM products WHERE vend_id = 1003;
+-----------+
| avg_price |
+-----------+
| 15.998000 |
+-----------+
- 分析:可以看到,在使用了
DISTINCT
后,此例子中的avg_price
比较高,因为有多个物品具有相同的较低价格。排除它们提升了平均价格。
12.3 组合聚集函数
目前为止的所有聚集函数例子都只涉及单个函数。但实际上SELECT
语句可根据需要包含多个聚集函数。请看下面的例子:
mysql> SELECT COUNT(*) AS num_items, MIN(prod_price) AS price_min, MAX(prod_price) AS price_max, AVG(prod_price) AS price_avg FROM products;
+-----------+-----------+-----------+-----------+
| num_items | price_min | price_max | price_avg |
+-----------+-----------+-----------+-----------+
| 14 | 2.50 | 55.00 | 16.133571 |
+-----------+-----------+-----------+-----------+
- 分析:这里用单条SELECT语句执行了4个聚集计算,返回4个值(products表中物品的数目,产品价格的最高、最低以及平均值)。
取别名:在指定别名以包含某个聚集函数的结果时,不应该使用表中实际的列名。虽然这样做并非不合法,但使用唯一的名字会使你的SQL更易于理解和使用(以及将来容易排除故障)。