Rumah > Artikel > pangkalan data > SQLServer中的GROUPING,ROLLUP和CUBE
聚集函数:GROUPING 用于汇总数据用的运算符: ROLLUP 1.用 CUBE 汇总数据 CUBE 运算符生成的结果集是多维数据集。多维数据集是事实数据的扩展,事实数据即记录个别事件的数据。扩展建立在用户打算分析的列上。这些列被称为维。多维数据集是一个结果集,其中包
聚集函数:GROUPING
用于汇总数据用的运算符: ROLLUP
1.用 CUBE 汇总数据
CUBE 运算符生成的结果集是多维数据集。多维数据集是事实数据的扩展,事实数据即记录个别事件的数据。扩展建立在用户打算分析的列上。这些列被称为维。多维数据集是一个结果集,其中包含了各维度的所有可能组合的交叉表格。
CUBE 运算符在 SELECT 语句的 GROUP BY 子句中指定。该语句的选择列表应包含维度列和聚合函数表达式。GROUP BY 应指定维度列和关键字 WITH CUBE。结果集将包含维度列中各值的所有可能组合,以及与这些维度值组合相匹配的基础行中的聚合值。
例如,一个简单的表 Inventory 中包含:
Item Color Quantity
-------------------- -------------------- --------------------------
Table Blue 124
Table Red 223
Chair Blue 101
Chair Red 210
我们先来准备测试表和数据
<span>IF</span> <span>object_id</span>(N<span>'</span><span>Inventory</span><span>'</span>,N<span>'</span><span>U</span><span>'</span>) <span>IS</span> <span>NOT</span> <span>NULL</span> <span>DROP</span> <span>TABLE</span><span> Inventory </span><span>CREATE</span> <span>TABLE</span><span> Inventory ( Item </span><span>varchar</span>(<span>255</span><span>), Color </span><span>varchar</span>(<span>255</span><span>), Quantity </span><span>decimal</span>(<span>18</span>,<span>8</span><span>) ) </span><span>--</span><span>插入数据</span> <span>INSERT</span> <span>INTO</span><span> Inventory </span><span>SELECT</span> <span>'</span><span>Chair</span><span>'</span>,<span>'</span><span>Blue</span><span>'</span>,<span>101.00</span> <span>UNION</span> <span>ALL</span> <span>SELECT</span> <span>'</span><span>Chair</span><span>'</span>, <span>'</span><span>Red</span><span>'</span>,<span>210.00</span> <span>UNION</span> <span>ALL</span> <span>SELECT</span> <span>'</span><span>Table</span><span>'</span>,<span>'</span><span>Blue</span><span>'</span>,<span>124.00</span> <span>UNION</span> <span>ALL</span> <span>SELECT</span> <span>'</span><span>Table</span><span>'</span>,<span>'</span><span>Red</span><span>'</span>,<span>223.00</span>
下列查询返回的结果集中,将包含 Item 和 Color 的所有可能组合的 Quantity 小计:
<span>SELECT</span> Item, Color, <span>SUM</span>(Quantity) <span>AS</span><span> QtySum </span><span>FROM</span><span> Inventory </span><span>GROUP</span> <span>BY</span> Item, Color <span>WITH</span> CUBE
下面是结果集:
Item Color QtySum
-------------------- -------------------- --------------------------
Chair Blue 101.00
Chair Red 210.00
Chair (null) 311.00
Table Blue 124.00
Table Red 223.00
Table (null) 347.00
(null) (null) 658.00
(null) Blue 225.00
(null) Red 433.00
我们着重考查下列各行:
Chair (null) 311.00
这一行报告了 Item 维度中值为 Chair 的所有行的小计。对 Color 维度返回了 NULL 值,表示该行所报告的聚合包括 Color 维度为任意值的行。
Table (null) 347.00
这一行类似,但报告的是 Item 维度中值为 Table 的所有行的小计。
(null) (null) 658.00
这一行报告了多维数据集的总计。Item 和 Color 维度的值都是 NULL,表示两个维度中的所有值都汇总在该行中。
(null) Blue 225.00
(null) Red 433.00
这两行报告了 Color 维度的小计。两行中的 Item 维度值都是 NULL,表示聚合数据来自 Item 维度为任意值的行。
使用 GROUPING 区分空值
CUBE 操作所生成的空值带来一个问题:如何区分 CUBE 操作所生成的 NULL 值和从实际数据中返回的 NULL 值?这个问题可用 GROUPING 函数解决。如果列中的值来自事实数据,则 GROUPING 函数返回 0;如果列中的值是 CUBE 操作所生成的 NULL,则返回 1。在 CUBE 操作中,所生成的 NULL 代表全体值。可将 SELECT 语句写成使用 GROUPING 函数将所生成的 NULL 替换为字符串 ALL。因为事实数据中的 NULL 表明数据值未知,所以 SELECT 语句还可译码为返回字符串 UNKNOWN 替代来自事实数据的 NULL。例如:
<span>SELECT</span> <span>CASE</span> <span>WHEN</span> (<span>GROUPING</span>(Item) <span>=</span> <span>1</span>) <span>THEN</span> <span>'</span><span>ALL</span><span>'</span> <span>ELSE</span> <span>ISNULL</span>(Item, <span>'</span><span>UNKNOWN</span><span>'</span><span>) </span><span>END</span> <span>AS</span><span> Item, </span><span>CASE</span> <span>WHEN</span> (<span>GROUPING</span>(Color) <span>=</span> <span>1</span>) <span>THEN</span> <span>'</span><span>ALL</span><span>'</span> <span>ELSE</span> <span>ISNULL</span>(Color, <span>'</span><span>UNKNOWN</span><span>'</span><span>) </span><span>END</span> <span>AS</span><span> Color, </span><span>SUM</span>(Quantity) <span>AS</span><span> QtySum </span><span>FROM</span><span> Inventory </span><span>GROUP</span> <span>BY</span> Item, Color <span>WITH</span> CUBE
--小小的解释一下,如果GROUPING(Item)如果是有值,那么GROUPING(Item)=0,那么这一整段都不会执行,那么程序将继续往下走,来到SUM(Quantity) AS QtySum这里,所以查出的结果也是有值的,所以值并不是ALL,ALL是当为Null的时候,也就是某一字段全部SUM的时候,明白了吗?这里我也花了一点时间才理解透,其实都很简单的--
多维数据集
CUBE 运算符可用于生成 n 维的多维数据集,即具有任意数目维度的多维数据集。只有一个维度的多维数据集可用于生成合计,例如:
<span>SELECT</span> <span>CASE</span> <span>WHEN</span> (<span>GROUPING</span>(Item) <span>=</span> <span>1</span>) <span>THEN</span> <span>'</span><span>ALL</span><span>'</span> <span>ELSE</span> <span>ISNULL</span>(Item, <span>'</span><span>UNKNOWN</span><span>'</span><span>) </span><span>END</span> <span>AS</span><span> Item, </span><span>SUM</span>(Quantity) <span>AS</span><span> QtySum </span><span>FROM</span><span> Inventory </span><span>GROUP</span> <span>BY</span> Item <span>WITH</span><span> CUBE </span><span>GO</span>
此 SELECT 语句返回的结果集既显示了 Item 中每个值的小计,也显示了 Item 中所有值的总计:
Item QtySum
-------------------- --------------------------
Chair 311.00
Table 347.00
ALL 658.00
包含带有许多维度的 CUBE 的 SELECT 语句可能生成很大的结果集,因为这些语句会为所有维度中值的所有组合生成行。这些大结果集包含的数据可能过多而不易于阅读和理解。这个问题有一种解决办法是将 SELECT 语句放在视图中:
CREATE VIEW InvCube AS <span>SELECT</span> <span>CASE</span> <span>WHEN</span> (<span>GROUPING</span>(Item) <span>=</span> <span>1</span>) <span>THEN</span> <span>'</span><span>ALL</span><span>'</span> <span>ELSE</span> <span>ISNULL</span>(Item, <span>'</span><span>UNKNOWN</span><span>'</span><span>) </span><span>END</span> <span>AS</span><span> Item, </span><span>CASE</span> <span>WHEN</span> (<span>GROUPING</span>(Color) <span>=</span> <span>1</span>) <span>THEN</span> <span>'</span><span>ALL</span><span>'</span> <span>ELSE</span> <span>ISNULL</span>(Color, <span>'</span><span>UNKNOWN</span><span>'</span><span>) </span><span>END</span> <span>AS</span><span> Color, </span><span>SUM</span>(Quantity) <span>AS</span><span> QtySum </span><span>FROM</span><span> Inventory </span><span>GROUP</span> <span>BY</span> Item, Color <span>WITH</span> CUBE
然后即可用该视图来只查询您感兴趣的维度值:
<span>SELECT</span> <span>*</span> <span>FROM</span><span> InvCube </span><span>WHERE</span> Item <span>=</span> <span>'</span><span>Chair</span><span>'</span> <span>AND</span> Color <span>=</span> <span>'</span><span>ALL</span><span>'</span>
Item Color QtySum
-------------------- -------------------- --------------------------
Chair ALL 311.00
(1 row(s) affected)
2.用 ROLLUP 汇总数据
在生成包含小计和合计的报表时,ROLLUP 运算符很有用。ROLLUP 运算符生成的结果集类似于 CUBE 运算符所生成的结果集。有关更多信息.
CUBE 和 ROLLUP 之间的区别在于:
例如,简单表 Inventory 中包含:
Item Color Quantity
-------------------- -------------------- --------------------------
Table Blue 124
Table Red 223
Chair Blue 101
Chair Red 210
下列查询将生成小计报表:
<span>SELECT</span> <span>CASE</span> <span>WHEN</span> (<span>GROUPING</span>(Item) <span>=</span> <span>1</span>) <span>THEN</span> <span>'</span><span>ALL</span><span>'</span> <span>ELSE</span> <span>ISNULL</span>(Item, <span>'</span><span>UNKNOWN</span><span>'</span><span>) </span><span>END</span> <span>AS</span><span> Item, </span><span>CASE</span> <span>WHEN</span> (<span>GROUPING</span>(Color) <span>=</span> <span>1</span>) <span>THEN</span> <span>'</span><span>ALL</span><span>'</span> <span>ELSE</span> <span>ISNULL</span>(Color, <span>'</span><span>UNKNOWN</span><span>'</span><span>) </span><span>END</span> <span>AS</span><span> Color, </span><span>SUM</span>(Quantity) <span>AS</span><span> QtySum </span><span>FROM</span><span> Inventory </span><span>GROUP</span> <span>BY</span> Item, Color <span>WITH</span> ROLLUP
Item Color QtySum
-------------------- -------------------- --------------------------
Chair Blue 101.00
Chair Red 210.00
Chair ALL 311.00
Table Blue 124.00
Table Red 223.00
Table ALL 347.00
ALL ALL 658.00
(7 row(s) affected)
如果查询中的 ROLLUP 关键字更改为 CUBE,那么 CUBE 结果集与上述结果相同,只是在结果集的末尾还会返回下列两行:
ALL Blue 225.00
ALL Red 433.00
CUBE 操作为 Item 和 Color 中值的可能组合生成行。例如,CUBE 不仅报告与 Item 值 Chair 相组合的 Color 值的所有可能组合(Red、Blue 和 Red + Blue),而且报告与 Color 值 Red 相组合的 Item 值的所有可能组合(Chair、Table 和 Chair + Table)。
对于 GROUP BY 子句中右边的列中的每个值,ROLLUP 操作并不报告左边一列(或左边各列)中值的所有可能组合。例如,ROLLUP 并不对每个 Color 值报告 Item 值的所有可能组合。
ROLLUP 操作的结果集具有类似于 COMPUTE BY 所返回结果集的功能;然而,ROLLUP 具有下列优点:
3.GROUPING
是一个聚合函数,它产生一个附加的列,当用 CUBE 或 ROLLUP 运算符添加行时,附加的列输出值为1,当所添加的行不是由 CUBE 或 ROLLUP 产生时,附加列值为0。
仅在与包含 CUBE 或 ROLLUP 运算符的 GROUP BY 子句相联系的选择列表中才允许分组。
语法
GROUPING ( column_name )
参数
column_name
是 GROUP BY 子句中用于检查 CUBE 或 ROLLUP 空值的列。
返回类型
int
注释
分组用于区分由 CUBE 和 ROLLUP 返回的空值和标准的空值。作为CUBE 或 ROLLUP 操作结果返回的 NULL 是 NULL 的特殊应用。它在结果集内作为列的占位符,意思是"全体"。
示例
下面的示例将 royalty 的数值分组,并聚合 advance 的数值。GROUPING 函数应用于 royalty 列。
<span>USE</span><span> pubs </span><span>SELECT</span> royalty, <span>SUM</span>(advance) <span>'</span><span>total advance</span><span>'</span><span>, </span><span>GROUPING</span>(royalty) <span>'</span><span>grp</span><span>'</span> <span>FROM</span><span> titles </span><span>GROUP</span> <span>BY</span> royalty <span>WITH</span> ROLLUP
结果集在 royalty 下显示两个空值。第一个 NULL 代表从表中这一列得到的空值组。第二个 NULL 在 ROLLUP 操作所添加的汇总行中。汇总行显示的是所有 royalty 组的 advance 合计数值,并且在 grp 列中用 1 标识。
下面是结果集:
royalty total advance grp
--------- --------------------- ---
NULL NULL 0
10 57000.0000 0
12 2275.0000 0
14 4000.0000 0
16 7000.0000 0
24 25125.0000 0
NULL 95400.0000 1