NULL | NULL |
|
이 병합된 테이블을 사용하면 다음 쿼리문과 같이 학생의 기본 정보뿐만 아니라 학생의 성적 정보도 하나의 쿼리문으로 쿼리할 수 있습니다.
SELECT number, name, major, subject, score FROM student_merge;
쿼리 목록의 이름
및 전공은 학생의 기본정보에 속하고, 과목
과 점수
는 학생의 성취정보에 속하며, 번호
에 속합니다. 성적 정보와 기본 정보 모두 student_merge
테이블의 쿼리 문에서 이 모든 정보를 쉽게 쿼리할 수 있습니다. 그러나 학생은 여러 과목에 대한 점수 정보를 가지고 있을 수 있다는 점을 잊지 마십시오. 즉, 학생의 과목에 대한 점수 정보를 추가할 때마다 해당 학생의 기본 정보를 다시 복사해야 합니다. 학생들의 기본 정보가 다음과 같은 문제를 야기하게 됩니다. name
和major
属于学生的基本信息,subject
和score
属于学生的成绩信息,而number
既属于成绩信息也属于基本信息,我们可以在一个对student_merge
表的查询语句中很轻松的把这些信息都查询出来。但是别忘了一个学生可能会有很多门学科的成绩信息,也就是说每当我们想为一个学生增加一门学科的成绩信息时,我们必须把他的基本信息再抄一遍,这种同一个学生的基本信息被冗余存储会带来下边的问题:
所以为了尽可能少的存储冗余信息,一开始我们就把这个所谓的student_merge
表拆分成了student_info
和student_score
表,但是这两张表之间有某种关系作为纽带,这里的某种关系
指的就是两个表都拥有的number
列。
连接的概念
拆分之后的表的确解决了数据冗余问题,但是查询数据却成了一个问题。截至目前为止,在我们介绍的查询方式中,查询结果集只能是一个表中的一个列或者多个列,也就是说到目前为止还没有一种可以在一条查询语句中把某个学生的number
、name
、major
、subject
、score
这几个信息都查询出来的方式。
小贴士: 虽然我们前边介绍的子查询可以在一个查询语句中涉及到多个表,但是整个查询语句最终产生的结果集还是用来展示外层查询的结果,子查询的结果只是被当作中间结果来使用。
时代在召唤一种可以在一个查询语句结果集中展示多个表的信息的方式,连接查询
承担了这个艰巨的历史使命。当然,为了故事的顺利发展,我们先建立两个简单的表并给它们填充一点数据:
mysql> CREATE TABLE t1 (m1 int, n1 char(1));
Query OK, 0 rows affected (0.02 sec)
mysql> CREATE TABLE t2 (m2 int, n2 char(1));
Query OK, 0 rows affected (0.02 sec)
mysql> INSERT INTO t1 VALUES(1, 'a'), (2, 'b'), (3, 'c');
Query OK, 3 rows affected (0.00 sec)
Records: 3 Duplicates: 0 Warnings: 0
mysql> INSERT INTO t2 VALUES(2, 'b'), (3, 'c'), (4, 'd');
Query OK, 3 rows affected (0.00 sec)
Records: 3 Duplicates: 0 Warnings: 0
mysql>
我们成功建立了t1
、t2
两个表,这两个表都有两个列,一个是INT
类型的,一个是CHAR(1)
类型的,填充好数据的两个表长这样:
mysql> SELECT * FROM t1;
+------+------+
| m1 | n1 |
+------+------+
| 1 | a |
| 2 | b |
| 3 | c |
+------+------+
3 rows in set (0.00 sec)
mysql> SELECT * FROM t2;
+------+------+
| m2 | n2 |
+------+------+
| 2 | b |
| 3 | c |
| 4 | d |
+------+------+
3 rows in set (0.00 sec)
mysql>
连接
的本质就是把各个表中的记录都取出来依次匹配的组合加入结果集并返回给用户。我们把t1和t2两个表连接起来的过程如下图所示:
这个过程看起来就是把t1表的记录和t2表的记录连起来组成新的更大的记录,所以这个查询过程称之为连接查询。连接查询的结果集中包含一个表中的每一条记录与另一个表中的每一条记录相互匹配的组合,像这样的结果集就可以称之为笛卡尔积
。因为表t1
中有3条记录,表t2
中也有3条记录,所以这两个表连接之后的笛卡尔积就有3×3=9
行记录。在MySQL
中,连接查询的语法也很随意,只要在FROM
语句后边跟多个用逗号,
隔开的表名就好了,比如我们把t1表和t2表连接起来的查询语句可以写成这样:
mysql> SELECT * FROM t1, t2;
+------+------+------+------+
| m1 | n1 | m2 | n2 |
+------+------+------+------+
| 1 | a | 2 | b |
| 2 | b | 2 | b |
| 3 | c | 2 | b |
| 1 | a | 3 | c |
| 2 | b | 3 | c |
| 3 | c | 3 | c |
| 1 | a | 4 | d |
| 2 | b | 4 | d |
| 3 | c | 4 | d |
+------+------+------+------+
9 rows in set (0.00 sec)
查询列表处的*
代表从FROM语句后列出的表中选取每个列,上边的查询语句其实和下边这几种写法都是等价的:
-
写法一:
SELECT t1.m1, t1.n1, t2.m2, t2.n2 FROM t1, t2;
这种写法是将t1
、t2
表中的列名都显式的写出来,也就是使用了列的全限定名。
-
写法二:
SELECT m1, n1, m2, n2 FROM t1, t2;
由于t1
、t2
表中的列名并不重复,所以没有可能让服务器懵逼的二义性,在查询列表上直接使用列名也是可以的。
-
写法三:
SELECT t1.*, t2.* FROM t1, t2;
这种写法意思就是查询t1
表的全部的列,t2
表的全部的列。
连接过程简介
如果我们乐意,我们可以连接任意数量张表,但是如果没有任何限制条件的话,这些表连接起来产生的笛卡尔积
可能是非常巨大的。比方说3个100行记录的表连接起来产生的笛卡尔积
就有100×100×100=1000000
- 문제 1: 저장 공간의 낭비.
🎜질문 2: 학생의 기본 정보를 수정할 때 여러 번 수정해야 하기 때문에 정보 불일치가 쉽게 발생하고 유지 관리의 어려움이 가중될 수 있습니다. 🎜
🎜그래서 중복되는 정보를 최대한 적게 저장하기 위해 소위 student_merge
테이블을 처음부터 student_info
로 분할하고 student_score
테이블이지만 이 두 테이블 사이에는 링크로 특정 관계가 있습니다. 여기서 특정 관계
는 두 테이블 모두에 있는 숫자
를 나타냅니다. >칼럼. 🎜연결의 개념
🎜분할 테이블은 데이터 중복 문제를 해결하지만 데이터 쿼리가 문제가 됩니다. 지금까지 소개한 쿼리 방법에서는 쿼리 결과 집합이 테이블의 한 열 또는 여러 열일 수만 있었습니다. 즉, 다음 정보를 하나의 쿼리 문에 학생의 정보를 결합할 수 있는 방법이 없습니다. : 번호
, 이름
, 주
, 제목
및 점수
가 방해가 되지 않음 . 🎜🎜팁: 앞서 소개한 하위 쿼리는 하나의 쿼리 문에 여러 테이블을 포함할 수 있지만 전체 쿼리 문에서 생성된 최종 결과 집합은 여전히 외부 쿼리의 결과를 표시하는 데 사용됩니다. 중간 결과로 사용됩니다. 🎜
🎜시대는 쿼리 결과 집합에 여러 테이블의 정보를 표시하는 방법을 요구하고 있습니다. Join 쿼리
는 이러한 힘든 역사적 임무를 수행했습니다. 물론 스토리의 원활한 전개를 위해 먼저 두 개의 간단한 테이블을 만들고 일부 데이터로 채웁니다. 🎜SELECT * FROM t1, t2 WHERE t1.m1 > 1 AND t1.m1 = t2.m2 AND t2.n2 🎜우리는 <code>t1</code> 및 <code>t2</code> 두 개의 테이블을 성공적으로 만들었습니다. 두 테이블 모두 두 개의 열이 있습니다. 하나는 <code>INT</code> 유형이고 다른 하나는 <code>CHAR(1)</code> 유형입니다. 데이터로 채워진 두 테이블은 다음과 같습니다. 🎜<pre class="brush:php;toolbar:false">+------+------+
| m1 | n1 |
+------+------+
| 2 | b |
| 3 | c |
+------+------+
2 rows in set (0.01 sec)
🎜The 연결
의 핵심은 각 테이블의 레코드를 꺼내고 일치하는 조합을 결과 집합에 추가하여 사용자에게 반환하는 것입니다. 두 테이블 t1과 t2를 연결하는 프로세스는 아래 그림에 나와 있습니다. 🎜🎜🎜이 과정은 t1 테이블의 레코드와 t2 테이블의 레코드를 연결하여 새로운 테이블을 구성하는 것으로 보입니다. 더 큰 레코드이므로 이 쿼리 프로세스를 연결 쿼리라고 합니다. 조인 쿼리의 결과 집합에는 다른 테이블의 각 레코드와 일치하는 한 테이블의 각 레코드 조합이 포함됩니다. 이러한 결과 집합을 Cartesian product
라고 부를 수 있습니다. 테이블 t1
에 3개의 레코드가 있고 테이블 t2
에 3개의 레코드가 있으므로 두 테이블을 조인한 후의 데카르트 곱은 3×3 =9
입니다. 라인 레코드. MySQL
에서는 연결 쿼리의 구문도 매우 임의적입니다. FROM
문 뒤에 쉼표 ,
로 구분된 여러 테이블 이름이 옵니다. 예를 들어, t1 테이블과 t2 테이블을 연결하는 데 사용하는 쿼리 문은 다음과 같이 작성할 수 있습니다. 🎜
+------+------+------+------+
| m1 | n1 | m2 | n2 |
+------+------+------+------+
| 2 | b | 2 | b |
+------+------+------+------+
🎜 쿼리 목록의 *
는 테이블 뒤에 나열된 테이블에서 각 열을 선택하는 것을 나타냅니다. FROM 문. 위의 쿼리 문은 실제로 다음 쓰기 방법과 동일합니다. 🎜🎜🎜🎜 쓰기 방법 1: 🎜+------+------+------+------+
| m1 | n1 | m2 | n2 |
+------+------+------+------+
| 3 | c | 3 | c |
+------+------+------+------+
🎜이 쓰기 방법은 테이블 t1
, t2
입니다. 의 열 이름은 명시적으로 작성됩니다. 즉, 열의 정규화된 이름이 사용됩니다. 🎜🎜🎜작성방법 2 : 🎜+------+------+------+------+
| m1 | n1 | m2 | n2 |
+------+------+------+------+
| 2 | b | 2 | b |
| 3 | c | 3 | c |
+------+------+------+------+
2 rows in set (0.00 sec)
🎜 t1
, t2
테이블의 컬럼명이 반복되지 않기 때문에 혼동을 줄 수 있는 모호함이 없습니다. 서버 쿼리 목록에서 직접 열 이름을 사용할 수도 있습니다. 🎜🎜🎜쓰기 방법 3: 🎜mysql> SELECT student_info.number, name, major, subject, score FROM student_info, student_score WHERE student_info.number = student_score.number;
+----------+-----------+--------------------------+-----------------------------+-------+
| number | name | major | subject | score |
+----------+-----------+--------------------------+-----------------------------+-------+
| 20180101 | 杜子腾 | 计算机科学与工程 | 母猪的产后护理 | 78 |
| 20180101 | 杜子腾 | 计算机科学与工程 | 论萨达姆的战争准备 | 88 |
| 20180102 | 杜琦燕 | 计算机科学与工程 | 母猪的产后护理 | 100 |
| 20180102 | 杜琦燕 | 计算机科学与工程 | 论萨达姆的战争准备 | 98 |
| 20180103 | 范统 | 软件工程 | 母猪的产后护理 | 59 |
| 20180103 | 范统 | 软件工程 | 论萨达姆的战争准备 | 61 |
| 20180104 | 史珍香 | 软件工程 | 母猪的产后护理 | 55 |
| 20180104 | 史珍香 | 软件工程 | 论萨达姆的战争准备 | 46 |
+----------+-----------+--------------------------+-----------------------------+-------+
8 rows in set (0.00 sec)
mysql>
🎜이 쓰기 방법은 t1
테이블의 모든 열과 t2
테이블의 모든 열을 쿼리하는 것을 의미합니다. . 🎜조인 프로세스 소개
🎜원한다면 원하는 수의 테이블을 조인할 수 있지만 제한이 없으면 이러한 조인을 통해 생성된 플루트 테이블 Karl 제품
은 매우 클 수 있습니다. 예를 들어, 100행의 레코드로 세 개의 테이블을 연결하여 생성된 데카르트 곱
은 100×100×100=1000000
행의 데이터를 갖게 됩니다! 따라서 연결 시 특정 레코드 조합을 필터링해야 합니다. 연결 쿼리의 필터 조건은 🎜🎜🎜🎜단일 테이블과 관련된 조건🎜 두 가지 유형으로 나눌 수 있습니다.这种只涉及单表的过滤条件我们之前都提到过一万遍了,我们之前也一直称为搜索条件
,比如t1.m1 > 1
是只针对t1
表的过滤条件,t2.n2 是只针对<code>t2
表的过滤条件。
涉及两表的条件
这种过滤条件我们之前没见过,比如t1.m1 = t2.m2
、t1.n1 > t2.n2
等,这些条件中涉及到了两个表,我们稍后会仔细分析这种过滤条件是如何使用的哈。
下边我们就要看一下携带过滤条件的连接查询的大致执行过程了,比方说下边这个查询语句:
SELECT * FROM t1, t2 WHERE t1.m1 > 1 AND t1.m1 = t2.m2 AND t2.n2 <p>在这个查询中我们指明了这三个过滤条件:</p>
t1.m1 > 1
t1.m1 = t2.m2
t2.n2
那么这个连接查询的大致执行过程如下:
-
首先确定第一个需要查询的表,这个表称之为驱动表
。此处假设使用t1
作为驱动表,那么就需要到t1
表中找满足t1.m1 > 1
的记录,符合这个条件的t1
表记录如下所示:
+------+------+
| m1 | n1 |
+------+------+
| 2 | b |
| 3 | c |
+------+------+
2 rows in set (0.01 sec)
我们可以看到,t1
表中符合t1.m1 > 1
的记录有两条。
-
上一步骤中从驱动表每获取到一条记录,都需要到t2
表中查找匹配的记录,所谓匹配的记录
,指的是符合过滤条件的记录。因为是根据t1
表中的记录去找t2
表中的记录,所以t2
表也可以被称之为被驱动表
。上一步骤从驱动表中得到了2条记录,也就意味着需要查询2次t2
表。此时涉及两个表的列的过滤条件t1.m1 = t2.m2
就派上用场了:
-
对于从t1
表种查询得到的第一条记录,也就是当t1.m1 = 2, t1.n1 = 'b'
时,过滤条件t1.m1 = t2.m2
就相当于t2.m2 = 2
,所以此时t2
表相当于有了t2.m2 = 2
、t2.n2 这两个过滤条件,然后到<code>t2
表中执行单表查询,将得到的记录和从t1
表中查询得到的第一条记录相组合得到下边的结果:
+------+------+------+------+
| m1 | n1 | m2 | n2 |
+------+------+------+------+
| 2 | b | 2 | b |
+------+------+------+------+
-
对于从t1
表种查询得到的第二条记录,也就是当t1.m1 = 3, t1.n1 = 'c'
时,过滤条件t1.m1 = t2.m2
就相当于t2.m2 = 3
,所以此时t2
表相当于有了t2.m2 = 3
、t2.n2 这两个过滤条件,然后到<code>t2
表中执行单表查询,将得到的记录和从t1
表中查询得到的第二条记录相组合得到下边的结果:
+------+------+------+------+
| m1 | n1 | m2 | n2 |
+------+------+------+------+
| 3 | c | 3 | c |
+------+------+------+------+
所以整个连接查询的执行最后得到的结果集就是这样:
+------+------+------+------+
| m1 | n1 | m2 | n2 |
+------+------+------+------+
| 2 | b | 2 | b |
| 3 | c | 3 | c |
+------+------+------+------+
2 rows in set (0.00 sec)
从上边两个步骤可以看出来,我们上边唠叨的这个两表连接查询共需要查询1次t1
表,2次t2
表。当然这是在特定的过滤条件下的结果,如果我们把t1.m1 > 1
这个条件去掉,那么从t1
表中查出的记录就有3条,就需要查询3次t2
表了。也就是说在两表连接查询中,驱动表只需要查询一次,被驱动表可能会被查询多次。
内连接和外连接
了解了连接查询的执行过程之后,视角再回到我们的student_info
表和student_score
表。现在我们想在一个查询语句中既查询到学生的基本信息,也查询到学生的成绩信息,就需要进行两表连接了。连接过程就是从student_info
表中取出记录,在student_score
表中查找number
值相同的成绩记录,所以过滤条件就是student_info.number = student_score.number
,整个查询语句就是这样:
mysql> SELECT student_info.number, name, major, subject, score FROM student_info, student_score WHERE student_info.number = student_score.number;
+----------+-----------+--------------------------+-----------------------------+-------+
| number | name | major | subject | score |
+----------+-----------+--------------------------+-----------------------------+-------+
| 20180101 | 杜子腾 | 计算机科学与工程 | 母猪的产后护理 | 78 |
| 20180101 | 杜子腾 | 计算机科学与工程 | 论萨达姆的战争准备 | 88 |
| 20180102 | 杜琦燕 | 计算机科学与工程 | 母猪的产后护理 | 100 |
| 20180102 | 杜琦燕 | 计算机科学与工程 | 论萨达姆的战争准备 | 98 |
| 20180103 | 范统 | 软件工程 | 母猪的产后护理 | 59 |
| 20180103 | 范统 | 软件工程 | 论萨达姆的战争准备 | 61 |
| 20180104 | 史珍香 | 软件工程 | 母猪的产后护理 | 55 |
| 20180104 | 史珍香 | 软件工程 | 论萨达姆的战争准备 | 46 |
+----------+-----------+--------------------------+-----------------------------+-------+
8 rows in set (0.00 sec)
mysql>
小贴士: student_info表和student_score表都有number列,不过我们在上述查询语句的查询列表中只放置了student_info表的number列,这是因为我们的过滤条件是student_info.number = student_score.number,从两个表中取出的记录的number列都相同,所以只需要放置一个表中的number列到查询列表即可,也就是说我们把student_score.number放到查询列表处也是可以滴~
从上述查询结果中我们可以看到,各个同学对应的各科成绩就都被查出来了,可是有个问题,范剑
和朱逸群
同学,也就是学号为20180105
和20180106
的同学因为某些原因没有参加考试,所以在studnet_score
表中没有对应的成绩记录。那如果老师想查看所有同学的考试成绩,即使是缺考的同学也应该展示出来,但是到目前为止我们介绍的连接查询
是无法完成这样的需求的。我们稍微思考一下这个需求,其本质是想:驱动表中的记录即使在被驱动表中没有匹配的记录,也仍然需要加入到结果集。为了解决这个问题,就有了内连接
和外连接
的概念:
对于内连接
的两个表,驱动表中的记录在被驱动表中找不到匹配的记录,该记录不会加入到最后的结果集,我们上边提到的连接都是所谓的内连接
。
-
对于外连接
的两个表,驱动表中的记录即使在被驱动表中没有匹配的记录,也仍然需要加入到结果集。
在MySQL
中,根据选取驱动表的不同,外连接仍然可以细分为2种:
-
左外连接
选取左侧的表为驱动表。
-
右外连接
选取右侧的表为驱动表。
可是这样仍然存在问题,即使对于外连接来说,有时候我们也并不想把驱动表的全部记录都加入到最后的结果集。这就犯难了,有时候匹配失败要加入结果集,有时候又不要加入结果集,这咋办,有点儿愁啊。。。噫,把过滤条件分为两种不就解决了这个问题了么,所以放在不同地方的过滤条件是有不同语义的:
-
WHERE
子句中的过滤条件
WHERE
子句中的过滤条件就是我们平时见的那种,不论是内连接还是外连接,凡是不符合WHERE
子句中的过滤条件的记录都不会被加入最后的结果集。
-
ON
子句中的过滤条件
对于外连接的驱动表的记录来说,如果无法在被驱动表中找到匹配ON
子句中的过滤条件的记录,那么该记录仍然会被加入到结果集中,对应的被驱动表记录的各个字段使用NULL
值填充。
需要注意的是,这个ON
子句是专门为外连接驱动表中的记录在被驱动表找不到匹配记录时应不应该把该记录加入结果集这个场景下提出的,所以如果把ON
子句放到内连接中,MySQL
会把它和WHERE
子句一样对待,也就是说:内连接中的WHERE子句和ON子句是等价的。
一般情况下,我们都把只涉及单表的过滤条件放到WHERE
子句中,把涉及两表的过滤条件都放到ON
子句中,我们也一般把放到ON
子句中的过滤条件也称之为连接条件
。
小贴士: 左外连接和右外连接简称左连接和右连接,所以下边提到的左外连接和右外连接中的`外`字都用括号扩起来,以表示这个字儿可有可无。
左(外)连接的语法
左(外)连接的语法还是挺简单的,比如我们要把t1
表和t2
表进行左外连接查询可以这么写:
SELECT * FROM t1 LEFT [OUTER] JOIN t2 ON 连接条件 [WHERE 普通过滤条件];
其中中括号里的OUTER
单词是可以省略的。对于LEFT JOIN
类型的连接来说,我们把放在左边的表称之为外表或者驱动表,右边的表称之为内表或者被驱动表。所以上述例子中t1
就是外表或者驱动表,t2
就是内表或者被驱动表。需要注意的是,对于左(外)连接和右(外)连接来说,必须使用ON
子句来指出连接条件。了解了左(外)连接的基本语法之后,再次回到我们上边那个现实问题中来,看看怎样写查询语句才能把所有的学生的成绩信息都查询出来,即使是缺考的考生也应该被放到结果集中:
mysql> SELECT student_info.number, name, major, subject, score FROM student_info LEFT JOIN student_score ON student_info.number = student_score.number;
+----------+-----------+--------------------------+-----------------------------+-------+
| number | name | major | subject | score |
+----------+-----------+--------------------------+-----------------------------+-------+
| 20180101 | 杜子腾 | 计算机科学与工程 | 母猪的产后护理 | 78 |
| 20180101 | 杜子腾 | 计算机科学与工程 | 论萨达姆的战争准备 | 88 |
| 20180102 | 杜琦燕 | 计算机科学与工程 | 母猪的产后护理 | 100 |
| 20180102 | 杜琦燕 | 计算机科学与工程 | 论萨达姆的战争准备 | 98 |
| 20180103 | 范统 | 软件工程 | 母猪的产后护理 | 59 |
| 20180103 | 范统 | 软件工程 | 论萨达姆的战争准备 | 61 |
| 20180104 | 史珍香 | 软件工程 | 母猪的产后护理 | 55 |
| 20180104 | 史珍香 | 软件工程 | 论萨达姆的战争准备 | 46 |
| 20180105 | 范剑 | 飞行器设计 | NULL | NULL |
| 20180106 | 朱逸群 | 电子信息 | NULL | NULL |
+----------+-----------+--------------------------+-----------------------------+-------+
10 rows in set (0.00 sec)
mysql>
从结果集中可以看出来,虽然范剑
和朱逸群
并没有对应的成绩记录,但是由于采用的是连接类型为左(外)连接,所以仍然把它放到了结果集中,只不过在对应的成绩记录的各列使用NULL
值填充而已。
右(外)连接的语法
右(外)连接和左(外)连接的原理是一样一样的,语法也只是把LEFT
换成RIGHT
而已:
SELECT * FROM t1 RIGHT [OUTER] JOIN t2 ON 连接条件 [WHERE 普通过滤条件];
只不过驱动表是右边的表,被驱动表是左边的表,具体就不唠叨了。
内连接的语法
内连接和外连接的根本区别就是在驱动表中的记录不符合ON
子句中的连接条件时不会把该记录加入到最后的结果集,我们最开始唠叨的那些连接查询的类型都是内连接。不过之前仅仅提到了一种最简单的内连接语法,就是直接把需要连接的多个表都放到FROM
子句后边。其实针对内连接,MySQL提供了好多不同的语法,我们以t1
和t2
表为例瞅瞅:
SELECT * FROM t1 [INNER | CROSS] JOIN t2 [ON 连接条件] [WHERE 普通过滤条件];
也就是说在MySQL
中,下边这几种内连接的写法都是等价的:
SELECT * FROM t1 JOIN t2;
SELECT * FROM t1 INNER JOIN t2;
SELECT * FROM t1 CROSS JOIN t2;
上边的这些写法和直接把需要连接的表名放到FROM
语句之后,用逗号,
分隔开的写法是等价的:
SELECT * FROM t1, t2;
现在我们虽然介绍了很多种内连接的书写方式,不过熟悉一种就好了,这里我们推荐INNER JOIN的形式书写内连接(因为INNER JOIN语义很明确嘛,可以和LEFT JOIN和RIGHT JOIN很轻松的区分开)。这里需要注意的是,由于在内连接中ON子句和WHERE子句是等价的,所以内连接中不要求强制写明ON子句。
我们前边说过,连接的本质就是把各个连接表中的记录都取出来依次匹配的组合加入结果集并返回给用户。不论哪个表作为驱动表,两表连接产生的笛卡尔积肯定是一样的。而对于内连接来说,由于凡是不符合ON子句或WHERE子句中的条件的记录都会被过滤掉,其实也就相当于从两表连接的笛卡尔积中把不符合过滤条件的记录给踢出去,所以对于内连接来说,驱动表和被驱动表是可以互换的,并不会影响最后的查询结果。但是对于外连接来说,由于驱动表中的记录即使在被驱动表中找不到符合ON子句连接条件的记录也会被加入结果集,所以此时驱动表和被驱动表的关系就很重要了,也就是说左外连接和右外连接的驱动表和被驱动表不能轻易互换。
小结
上边说了很多,给大家的感觉不是很直观,我们直接把表t1和t2的三种连接方式写在一起,这样大家理解起来就很easy了:
mysql> SELECT * FROM t1 INNER JOIN t2 ON t1.m1 = t2.m2;
+------+------+------+------+
| m1 | n1 | m2 | n2 |
+------+------+------+------+
| 2 | b | 2 | b |
| 3 | c | 3 | c |
+------+------+------+------+
2 rows in set (0.00 sec)
mysql> SELECT * FROM t1 LEFT JOIN t2 ON t1.m1 = t2.m2;
+------+------+------+------+
| m1 | n1 | m2 | n2 |
+------+------+------+------+
| 2 | b | 2 | b |
| 3 | c | 3 | c |
| 1 | a | NULL | NULL |
+------+------+------+------+
3 rows in set (0.00 sec)
mysql> SELECT * FROM t1 RIGHT JOIN t2 ON t1.m1 = t2.m2;
+------+------+------+------+
| m1 | n1 | m2 | n2 |
+------+------+------+------+
| 2 | b | 2 | b |
| 3 | c | 3 | c |
| NULL | NULL | 4 | d |
+------+------+------+------+
3 rows in set (0.00 sec)
连接查询产生的结果集就好像把散布到两个表中的信息被重新粘贴到了一个表,这个粘贴后的结果集可以方便我们分析数据,就不用老是两个表对照的看了。
多表连接
上边说过,如果我们乐意的话可以连接任意数量的表,我们再来创建一个简单的t3
表:
mysql> CREATE TABLE t3 (m3 int, n3 char(1));
ERROR 1050 (42S01): Table 't3' already exists
mysql> INSERT INTO t3 VALUES(3, 'c'), (4, 'd'), (5, 'e');
Query OK, 3 rows affected (0.01 sec)
Records: 3 Duplicates: 0 Warnings: 0
mysql>
与t1
和t2
表的结构一样,也是一个INT
列,一个CHAR(1)
列,现在我们看一下把这3个表连起来的样子:
mysql> SELECT * FROM t1 INNER JOIN t2 INNER JOIN t3 WHERE t1.m1 = t2.m2 AND t1.m1 = t3.m3;
+------+------+------+------+------+------+
| m1 | n1 | m2 | n2 | m3 | n3 |
+------+------+------+------+------+------+
| 3 | c | 3 | c | 3 | c |
+------+------+------+------+------+------+
1 row in set (0.00 sec)
mysql>
其实上边的查询语句也可以写成这样,用哪个取决于你的心情:
SELECT * FROM t1 INNER JOIN t2 ON t1.m1 = t2.m2 INNER JOIN t3 ON t1.m1 = t3.m3;
这个查询的执行过程用伪代码表示一下就是这样:
for each row in t1 {
for each row in t2 which satisfies t1.m1 = t2.m2 {
for each row in t3 which satisfies t1.m1 = t3.m3 {
send to client;
}
}
}
其实不管是多少个表的连接
,本质上就是各个表的记录在符合过滤条件下的自由组合。
表的别名
我们前边曾经为列命名过别名,比如说这样:
mysql> SELECT number AS xuehao FROM student_info;
+----------+
| xuehao |
+----------+
| 20180104 |
| 20180102 |
| 20180101 |
| 20180103 |
| 20180105 |
| 20180106 |
+----------+
6 rows in set (0.00 sec)
mysql>
我们可以把列的别名用在ORDER BY
、GROUP BY
等子句上,比如这样:
mysql> SELECT number AS xuehao FROM student_info ORDER BY xuehao DESC;
+----------+
| xuehao |
+----------+
| 20180106 |
| 20180105 |
| 20180104 |
| 20180103 |
| 20180102 |
| 20180101 |
+----------+
6 rows in set (0.00 sec)
mysql>
与列的别名类似,我们也可以为表来定义别名,格式与定义列的别名一致,都是用空白字符或者AS
隔开,这个在表名特别长的情况下可以让语句表达更清晰一些,比如这样:
mysql> SELECT s1.number, s1.name, s1.major, s2.subject, s2.score FROM student_info AS s1 INNER JOIN student_score AS s2 WHERE s1.number = s2.number;
+----------+-----------+--------------------------+-----------------------------+-------+
| number | name | major | subject | score |
+----------+-----------+--------------------------+-----------------------------+-------+
| 20180101 | 杜子腾 | 计算机科学与工程 | 母猪的产后护理 | 78 |
| 20180101 | 杜子腾 | 计算机科学与工程 | 论萨达姆的战争准备 | 88 |
| 20180102 | 杜琦燕 | 计算机科学与工程 | 母猪的产后护理 | 100 |
| 20180102 | 杜琦燕 | 计算机科学与工程 | 论萨达姆的战争准备 | 98 |
| 20180103 | 范统 | 软件工程 | 母猪的产后护理 | 59 |
| 20180103 | 范统 | 软件工程 | 论萨达姆的战争准备 | 61 |
| 20180104 | 史珍香 | 软件工程 | 母猪的产后护理 | 55 |
| 20180104 | 史珍香 | 软件工程 | 论萨达姆的战争准备 | 46 |
+----------+-----------+--------------------------+-----------------------------+-------+
8 rows in set (0.00 sec)
mysql>
这个例子中,我们在FROM
子句中给student_info
定义了一个别名s1
,student_score
定义了一个别名s2
,那么在整个查询语句的其他地方就可以引用这个别名来替代该表本身的名字了。
自连接
我们上边说的都是多个不同的表之间的连接,其实同一个表也可以进行连接。比方说我们可以对两个t1
表来生成笛卡尔积
,就像这样:
mysql> SELECT * FROM t1, t1;
ERROR 1066 (42000): Not unique table/alias: 't1'
mysql>
咦,报了个错,这是因为设计MySQL的大叔不允许FROM
子句中出现相同的表名。我们这里需要的是两张一模一样的t1
表进行连接,为了把两个一样的表区分一下,需要为表定义别名。比如这样:
mysql> SELECT * FROM t1 AS table1, t1 AS table2;
+------+------+------+------+
| m1 | n1 | m1 | n1 |
+------+------+------+------+
| 1 | a | 1 | a |
| 2 | b | 1 | a |
| 3 | c | 1 | a |
| 1 | a | 2 | b |
| 2 | b | 2 | b |
| 3 | c | 2 | b |
| 1 | a | 3 | c |
| 2 | b | 3 | c |
| 3 | c | 3 | c |
+------+------+------+------+
9 rows in set (0.00 sec)
mysql>
这里相当于我们为t1
表定义了两个副本,一个是table1
,另一个是table2
,这里的连接过程就不赘述了,大家把它们认为是不同的表就好了。由于被连接的表其实是源自同一个表,所以这种连接也称为自连接
。我们看一下这个自连接
的现实意义,比方说我们想查看与'史珍香'
相同专业的学生有哪些,可以这么写:
mysql> SELECT s2.number, s2.name, s2.major FROM student_info AS s1 INNER JOIN student_info AS s2 WHERE s1.major = s2.major AND s1.name = '史珍香' ;
+----------+-----------+--------------+
| number | name | major |
+----------+-----------+--------------+
| 20180103 | 范统 | 软件工程 |
| 20180104 | 史珍香 | 软件工程 |
+----------+-----------+--------------+
2 rows in set (0.01 sec)
mysql>
s1
、s2
都可以看作是student_info
表的一份副本,我们可以这样理解这个查询:
-
根据s1.name = '史珍香'
搜索条件过滤s1
表,可以得到该同学的基本信息:
+----------+-----------+------+--------------------+-----------------+--------------+-----------------+
| number | name | sex | id_number | department | major | enrollment_time |
+----------+-----------+------+--------------------+-----------------+--------------+-----------------+
| 20180104 | 史珍香 | 女 | 141992199701078600 | 计算机学院 | 软件工程 | 2018-09-01 |
+----------+-----------+------+--------------------+-----------------+--------------+-----------------+
-
因为通过查询s1
表,得到了'史珍香'
所在的专业其实是'软件工程'
,接下来就应该查询s2
表了,查询s2
表的时候的过滤条件s1.major = s2.major
就相当于s2.major = '软件工程'
,于是查询到2条记录:
+----------+-----------+------+--------------------+-----------------+--------------+-----------------+
| number | name | sex | id_number | department | major | enrollment_time |
+----------+-----------+------+--------------------+-----------------+--------------+-----------------+
| 20180103 | 范统 | 男 | 17156319980116959X | 计算机学院 | 软件工程 | 2018-09-01 |
| 20180104 | 史珍香 | 女 | 141992199701078600 | 计算机学院 | 软件工程 | 2018-09-01 |
+----------+-----------+------+--------------------+-----------------+--------------+-----------------+
而我们只需要s2
表的number
、name
、major
这3个列的数据,所以最终的结果就长这样:
+----------+-----------+--------------+
| number | name | major |
+----------+-----------+--------------+
| 20180103 | 范统 | 软件工程 |
| 20180104 | 史珍香 | 软件工程 |
+----------+-----------+--------------+
连接查询与子查询的转换
有的查询需求既可以使用连接查询解决,也可以使用子查询解决,比如
SELECT * FROM student_score WHERE number IN (SELECT number FROM student_info WHERE major = '计算机科学与工程');
这个子查询就可以被替换:
SELECT s2.* FROM student_info AS s1 INNER JOIN student_score AS s2 WHERE s1.number = s2.number AND s1.major = '计算机科学与工程';
大家在实际使用时可以按照自己的习惯来书写查询语句。
小贴士: MySQL服务器在内部可能将子查询转换为连接查询来处理,当然也可能用别的方式来处理,不过对于我们刚入门的小白来说,这些都不重要,知道这个语句会把哪些信息查出来就好了!
推荐学习:mysql视频教程