집 >데이터 베이스 >MySQL 튜토리얼 >SQLServer学习笔记系列5
一.写在前面的话 转眼又是一年清明节,话说清明时节雨纷纷,武汉的天气伴随着这个清明节下了一场暴雨,整个城市如海一样,朋友圈渗透着清明节武汉看海的节奏。今年又没有回老家祭祖,但是心里依然是怀念着那些亲人,虽说他们已离我们远去,然而那些血浓于水
转眼又是一年清明节,话说“清明时节雨纷纷”,武汉的天气伴随着这个清明节下了一场暴雨,整个城市如海一样,朋友圈渗透着清明节武汉看海的节奏。今年又没有回老家祭祖,但是心里依然是怀念着那些亲人,虽说他们已离我们远去,然而那些血浓于水的亲情是一辈子无法忘记的,在心里深深的想念他们。生活继续,激情永恒!时刻保持着奋斗的节奏,为那些爱我们的和我爱的人,好好活着,做一个斗士,让我们都能够获得幸福!继续我们的学习吧!在这里首先分享海子的一首诗:
面对大河我无限惭愧,
我年华虚度,空有一身疲倦,
和所有以梦为马的诗人一样,
岁月易逝,一点不剩。
------ 摘自《海子的诗》
在这里我们加入要查询2008年每一天的订单有多少?首先我们可以查询下订单表的订单日期在2008年的所有订单信息。
<span>1</span> <span>select</span> distinct orderdate,count(*) <span>as</span> N<span>'</span><span>每日订单量</span><span>'</span> <span>from</span><span> sales.orders </span><span>2</span> <span>where</span> orderdate between <span>'</span><span>20080101</span><span>'</span> and <span>'</span><span>20081231</span><span>'</span> <span>3</span> group by orderdate
查询结果如图:
从上面可以看出来,每天的订单的数量根据orderdate分组以后统计出来啦,但是我们发现有的日期是不存在的,比如2008-01-01、2008-01-02....却没有发现2008-01-03日期的订单数量,加入我们要求看到每天的订单了?(这种要求大多数来源于财务报表的统计),这就要求我们进行表构造,我们可以构造一个包含2008年的每一年日期,然后进行表关不就得出来每一天的都包含的订单嘛。说着我就开始做吧,先开始构造一个包含2008年每一天的表。
<span>1</span> <span> create table nums </span><span>2</span> <span> ( </span><span>3</span> n <span>int</span> <span>4</span> <span> ); </span><span>5</span> <span>6</span> <span>select</span> * <span>from</span> nums;
创建一个nums空表,用来保存连续的日期。接着就可以往表里面插入一些数据。
<span>1</span> declare @i <span>int</span><span>; </span><span>2</span> <span>set</span> @i=<span>0</span><span>; </span><span>3</span> <span>while</span> @i400 <span>4</span> <span> begin </span><span>5</span> <span>set</span> @i=@i+<span>1</span><span>; </span><span>6</span> <span> insert into nums(n) values(@i); </span><span>7</span> end
可以看到表里面插入和1到400有序的数字:
接着我们就可以构造连续日期了,日期的相加前面已经学习过dateadd(),如果想一起学习一下,可以看一下前面的笔记:
sqlserver学习笔记1:http://www.cnblogs.com/liupeng61624/p/4354983.html
sqlserver学习笔记2:http://www.cnblogs.com/liupeng61624/p/4367580.html
sqlserver学习笔记3:http://www.cnblogs.com/liupeng61624/p/4375135.html
sqlserver学习笔记4:http://www.cnblogs.com/liupeng61624/p/4388959.html
继续说日期的相加,在这里我们通过日期相加,就可以构造2008年的每一天:
<span>1</span> <span>select</span> dateadd(day,n,<span>'</span><span>20071231</span><span>'</span><span>) </span><span>2</span> <span>from</span> nums;
构造的日期结果如图:
日期构造完以后,那么我们就可以利用这个结果集跟订单表Sales.orders进行一个连接。
<span>1</span> <span>select</span> dateadd(day,f.n,<span>'</span><span>20071231</span><span>'</span>),count(orderid) <span>as</span> N<span>'</span><span>每日订单数量</span><span>'</span> <span>2</span> <span>from</span><span> nums f left join sales.orders m on </span><span>3</span> dateadd(day,f.n,<span>'</span><span>20071231</span><span>'</span>)=<span> m.orderdate </span><span>4</span> group by dateadd(day,f.n,<span>'</span><span>20071231</span><span>'</span><span>) </span><span>5</span> order by dateadd(day,f.n,<span>'</span><span>20071231</span><span>'</span>)
结果如图所示:
(2)子查询,即查询结果可以作为一个查询条件。
例如:我们要查询雇员表(Hr.employees)里面年龄最小的雇员信息。sql语句可以这样写:
<span>1</span> <span>select</span> max(birthdate) <span>as</span> N<span>'</span><span>生日</span><span>'</span> <span>2</span> <span>from</span> hr.employees
在这里我们知道可以用聚合函数max进行查询,但是加入我们还要查询出年龄最小的名字,即lastname,sql语句如下,可以发现报错,因为max聚合函数,是对一组结果进行处理,而lastname并不包含在聚合函数中,故报错。
那么在这里我们就要用到子查询来处理,可以讲年龄最小的结果作为查询结果来进一步查询。
<span>1</span> <span>select</span><span> birthdate,lastname </span><span>2</span> <span>from</span><span> hr.employees </span><span>3</span> <span>where</span> birthdate= <span>4</span> <span> ( </span><span>5</span> <span>select</span><span> max(birthdate) </span><span>6</span> <span>from</span><span> hr.employees </span><span>7</span> )
查询结果如图所示:
继续子查询,加入我们要将下订单最贵的那个客户找出来,给颁发一个Svip级别荣誉,并且找出他所在的国家已经他个人的一些基本信息。
根据上面子查询,我们可以这样写我们的sql,首在这里视图Sales.OrderValues里面存储的是订单的一些价格信息。故我们对这张视图进行操作。
<span>1</span> <span>2</span> <span>select</span> max(val) <span>as</span> N<span>'</span><span>最贵订单</span><span>'</span> <span>3</span> <span>from</span> Sales.OrderValues
2. 然后找出最贵订单的顾客ID是多少
<span>1</span> <span>select</span> custid <span>from</span><span> Sales.OrderValues </span><span>2</span> <span>where</span> val=<span>( </span><span>3</span> <span>select</span> max(val) <span>as</span> N<span>'</span><span>最贵订单</span><span>'</span> <span>4</span> <span>from</span><span> Sales.OrderValues </span><span>5</span> )
3. 接着我们就可以在顾客表里面找出ID等于查询来的这个ID,同时查找出所在国家。
<span> 1</span> <span>select</span><span> custid,contactname,country </span><span> 2</span> <span>from</span> sales.customers <span>where</span> custid= <span> 3</span> <span> ( </span><span> 4</span> <span>select</span> custid <span>from</span><span> Sales.OrderValues </span><span> 5</span> <span>where</span> val= <span> 6</span> <span> ( </span><span> 7</span> <span>select</span> max(val) <span>as</span> N<span>'</span><span>最贵订单</span><span>'</span> <span> 8</span> <span>from</span><span> Sales.OrderValues </span><span> 9</span> <span> ) </span><span>10</span> )
结果如图所示:
例如:我们要查询每个顾客下的订单数量,前面我们已经学习过,有两种方法都可以实现:
1.用group......by分组
<span>1</span> <span>select</span> custid, count(*) <span>as</span> N<span>'</span><span>订单数量</span><span>'</span> <span>from</span><span> sales.orders </span><span>2</span> group by custid order by custid
2.利用count.....over
<span>1</span> <span>select</span> distinct custid,count(*) over (partition by custid) <span>as</span> N<span>'</span><span>订单数量</span><span>'</span> <span>2</span> <span>from</span> sales.orders
第三种方式我们就用相关子查询来解决,可以这样理解:就是我们没查一位顾客的订单数量就是去订单表里面顾客Id相同的都取出来,然后利用聚合函数求和。顾客ID我们可以从顾客表里面取出来,然后这个ID就等于订单表里面的ID。所以根据分析我们写sql如下:
<span>1</span> <span>select</span><span> n.custid,n.contactname, </span><span>2</span> <span> ( </span><span>3</span> <span>select</span> count(*<span>) </span><span>4</span> <span>from</span><span> sales.orders m </span><span>5</span> <span>where</span> m.custid=<span>n.custid </span><span>6</span> ) <span>as</span> N<span>'</span><span>订单数量</span><span>'</span> <span>7</span> <span>from</span> sales.customers n
其结果如图所示:
这样也可以把顾客下的订单数量算出来,这里就是利用到了外层查询跟内层查询条件作为比对求和。也就是我们说的相关子查询。
例如:我们要查询存在顾客但却没有供应商的国家,即这个国家中有顾客,没有供应商公司。
一般情况下:我们会采用常用的sql写法:
<span>1</span> <span>2</span> <span>select</span> distinct m.country <span>from</span><span> sales.customers m </span><span>3</span> <span>where</span> m.country not <span>in</span> <span>4</span> <span> ( </span><span>5</span> <span>select</span> n.country <span>from</span><span> production.suppliers n </span><span>6</span> )
结果如图所示:
既然有了not.....in写法,当然存在exists的写法,同样可以实现要求,exists对于结果集若存在则返回true,不存在返回false。我们可以这样理解:外层查询将country传递到内层查询,看看存不存在其中,其中内存查询包含多个结果,所以就叫做多值子查询。所以sql语句可以这样写:
<span>1</span> <span>select</span> distinct m.country <span>from</span><span> sales.customers m </span><span>2</span> <span>where</span><span> not exists </span><span>3</span> <span> ( </span><span>4</span> <span>select</span> n.country <span>from</span><span> production.suppliers n </span><span>5</span> <span>where</span> n.country=<span> m.country </span><span>6</span> )
结果如图所示:
可以看到其结果跟not.....in查出来的结果一样,满足条件。
(1)例如:假如我们要查询所有订单当前订单的前一个订单和后一个订单信息,这里我们先分析:
1.首先我们先可以查询出所有的订单。
<span>1</span> <span>select</span><span> distinct custid </span><span>2</span> <span>from</span> sales.orders
2.然后查询比当前订单Id小于的订单,同时这个订单是小于当前订单中最大的那个订单(即紧挨着的订单)。
<span>1</span> <span>select</span><span> distinct </span><span>2</span> <span> ( </span><span>3</span> <span>select</span> max(custid) <span>from</span> <span>4</span> sales.orders m <span>where</span> m.custid n.custid <span>5</span> ) <span>as</span> N<span>'</span><span>前一个订单</span><span>'</span>,n.custid <span>as</span> N<span>'</span><span>当前订单</span><span>'</span> <span>6</span> <span>7</span> <span>from</span> sales.orders n
3.同理,可以查出大于当前订单的那个紧挨着的那个订单。
<span> 1</span> <span>select</span><span> distinct </span><span> 2</span> <span> ( </span><span> 3</span> <span>select</span> max(custid) <span>from</span> <span> 4</span> sales.orders m <span>where</span> m.custid n.custid <span> 5</span> ) <span>as</span> N<span>'</span><span>前一个订单</span><span>'</span>,n.custid <span>as</span> N<span>'</span><span>当前订单</span><span>'</span><span>, </span><span> 6</span> <span> ( </span><span> 7</span> <span>select</span> min(custid) <span>from</span> <span> 8</span> sales.orders p <span>where</span> p.custid><span> n.custid </span><span> 9</span> ) <span>as</span> N<span>'</span><span>后一个订单</span><span>'</span> <span>10</span> <span>from</span> sales.orders n
其结果如图所示:
(2)累计聚合
累计聚合在财务统计中,经常用到,比如2007年卖出多少,2008年卖出多少,那么2008年累计卖出就是2007年加上2008年卖出的总和,即累计聚合。
在这里我们有视图Sales.OrderTotalsByYear,其中统计的是每一年的订单总量。
<span>1</span> <span>select</span> * <span>from</span> Sales.OrderTotalsByYear
我们可以看到2007年有25489张订单,2008年有16247张订单,2006年有9581张订单。加入我们要求每年累计卖了多少订单,就要用到累计聚合。
<span>1</span> <span>select</span><span> n.orderyear, </span><span>2</span> <span>( </span><span>3</span> <span>select</span><span> sum(qty) </span><span>4</span> <span>from</span><span> Sales.OrderTotalsByYear m </span><span>5</span> <span>where</span> m.orderyearn.orderyear <span>6</span> ) <span>as</span> N<span>'</span><span>累计订单数量</span><span>'</span> <span>7</span> <span>from</span><span> Sales.OrderTotalsByYear n </span><span>8</span> order by n.orderyear;
结果如图所示:
今天就学习到这,下次接着学习CTE,有了CTE会让我们的查询更加爽,特别是在用到递归的时候。
希望各位大牛给出指导,不当之处虚心接受学习!谢谢!