mysql系列V-多表查询
之前的系列查询都是单表查询,而本文则主要是多表查询操作,主要从以下几个方面进行讲解。
多表关系
项目开发中,在进行数据库表结构设计时,会根据业务需求及业务模块之间的关系,分析并设计表结构,由于业务之间相互关联,所以各个表结构之间也存在着各种联系,基本上分为三种:
- 一对多(多对一)
- 多对多
- 一对一
一对多
案例: 部门 与 员工的关系
关系: 一个部门对应多个员工,一个员工对应一个部门
实现: 在多的一方建立外键,指向一的一方的主键
多对多
案例: 学生 与 课程的关系
关系: 一个学生可以选修多门课程,一门课程也可以供多个学生选择
实现: 建立第三张中间表,中间表至少包含两个外键,分别关联两方主键
对应的SQL
脚本:
1 | CREATE TABLE student ( id INT auto_increment PRIMARY KEY COMMENT '主键ID', NAME VARCHAR ( 10 ) COMMENT '姓名', NO VARCHAR ( 10 ) COMMENT '学号' ) COMMENT '学生表'; |
一对一
案例: 用户 与 用户详情的关系
关系: 一对一关系,多用于单表拆分,将一张表的基础字段放在一张表中,其他详情字段放在另一张表中,以提升操作效率
实现: 在任意一方加入外键,关联另外一方的主键,并且设置外键为唯一的(UNIQUE)
对应的SQL
脚本:
1 | CREATE TABLE tb_user ( |
多表查询概述
数据准备
1). 删除之前 emp, dept表的测试数据
2). 执行如下脚本,创建emp表与dept表并插入测试数据
1 | -- 创建dept表,并插入数据 |
dept
表共6条记录,emp
表共17条记录。
概述
多表查询就是指从多张表中查询数据。
原来查询单表数据,执行的SQL
形式为:select * from emp;
那么我们要执行多表查询,就只需要使用逗号分隔多张表即可,如: select * from emp , dept;
具体的执行结果如下:
此时,我们看到查询结果中包含了大量的结果集,总共102条记录,而这其实就是员工表emp所有的记录
(17) 与 部门表dept所有记录(6) 的所有组合情况,这种现象称之为笛卡尔积。接下来,就来简单介绍下笛卡尔积。
笛卡尔积: 笛卡尔乘积是指在数学中,两个集合A集合 和 B集合的所有组合情况
而在多表查询中,我们是需要消除无效的笛卡尔积的,只保留两张表关联部分的数据。
在SQL
语句中,如何来去除无效的笛卡尔积呢? 我们可以给多表查询加上连接查询的条件即可。
select * from emp , dept where emp.dept_id = dept.id;
而由于id为17的员工,没有dept_id字段值,所以在多表查询时,根据连接查询的条件并没有查询到。
分类
连接查询
内连接:相当于查询A、B交集部分数据
外连接:
左外连接:查询左表所有数据,以及两张表交集部分数据
右外连接:查询右表所有数据,以及两张表交集部分数据
自连接:当前表与自身的连接查询,自连接必须使用表别名
子查询
内连接
内连接查询的是两张表交集部分的数据。(也就是绿色部分的数据)
内连接的语法分为两种: 隐式内连接、显式内连接。先来学习一下具体的语法结构。
1). 隐式内连接
1 | SELECT 字段列表 FROM 表1 , 表2 WHERE 条件 ... ; |
2). 显式内连接
1 | SELECT 字段列表 FROM 表1 [ INNER ] JOIN 表2 ON 连接条件 ... ; |
案例:
A. 查询每一个员工的姓名 , 及关联的部门的名称 (隐式内连接实现)
表结构: emp , dept
连接条件: emp.dept_id = dept.id
1 | select emp.name , dept.name from emp , dept where emp.dept_id = dept.id ; |
B. 查询每一个员工的姓名 , 及关联的部门的名称 (显式内连接实现) — INNER JOIN
…
ON …
表结构: emp , dept
连接条件: emp.dept_id = dept.id
1 | select e.name, d.name from emp e inner join dept d on e.dept_id = d.id; |
外连接
外连接分为两种,分别是:左外连接 和 右外连接。具体的语法结构为:
1). 左外连接
1 | SELECT 字段列表 FROM 表1 LEFT [ OUTER ] JOIN 表2 ON 条件 ... ; |
左外连接相当于查询表1(左表)的所有数据,当然也包含表1和表2交集部分的数据。
2). 右外连接
1 | SELECT 字段列表 FROM 表1 RIGHT [ OUTER ] JOIN 表2 ON 条件 ... ; |
右外连接相当于查询表2(右表)的所有数据,当然也包含表1和表2交集部分的数据。
案例:
A. 查询emp表的所有数据, 和对应的部门信息
由于需求中提到,要查询emp的所有数据,所以是不能内连接查询的,需要考虑使用外连接查询。
表结构: emp, dept
连接条件: emp.dept_id = dept.id
1 | select e.*, d.name from emp e left outer join dept d on e.dept_id = d.id; |
B. 查询dept表的所有数据, 和对应的员工信息(右外连接)
由于需求中提到,要查询dept表的所有数据,所以是不能内连接查询的,需要考虑使用外连接查
询。
表结构: emp, dept
连接条件: emp.dept_id = dept.id
1 | select d.*, e.* from emp e right outer join dept d on e.dept_id = d.id; |
自连接
自连接查询
自连接查询,顾名思义,就是自己连接自己,也就是把一张表连接查询多次。我们先来学习一下自连接的查询语法:
1 | SELECT 字段列表 FROM 表A 别名A JOIN 表A 别名B ON 条件 ... ; |
而对于自连接查询,可以是内连接查询,也可以是外连接查询。
案例:
A. 查询员工 及其 所属领导的名字
表结构: emp
1 | select a.name , b.name from emp a , emp b where a.managerid = b.id; |
B. 查询所有员工 emp 及其领导的名字 emp , 如果员工没有领导, 也需要查询出来
表结构: emp a , emp b
1 | select a.name '员工', b.name '领导' from emp a left join emp b on a.managerid = b.id; |
注意事项:
在自连接查询中,必须要为表起别名,要不然我们不清楚所指定的条件、返回的字段,到底是哪一张表的字段。
联合查询
对于union查询,就是把多次查询的结果合并起来,形成一个新的查询结果集。
1 | SELECT 字段列表 FROM 表A ... |
- 对于联合查询的多张表的列数必须保持一致,字段类型也需要保持一致。
union all
会将全部的数据直接合并在一起,union 会对合并之后的数据去重。
案例:
A. 将薪资低于 5000 的员工 , 和 年龄大于 50 岁的员工全部查询出来.
当前对于这个需求,我们可以直接使用多条件查询,使用逻辑运算符 or 连接即可。 那这里呢,我们也可以通过union/union all来联合查询.
1 | select * from emp where salary < 5000 |
union all
查询出来的结果,仅仅进行简单的合并,并未去重。
1 | select * from emp where salary < 5000 |
union
联合查询,会对查询出来的结果进行去重处理。
注意:
如果多条查询语句查询出来的结果,字段数量不一致,在进行union/union all联合查询时,将会报错。如:
1 | mysql> select * from emp where salary < 5000 |
子查询
概述
1). 概念SQL
语句中嵌套SELECT
语句,称为嵌套查询,又称子查询。
1 | SELECT * FROM t1 WHERE column1 = ( SELECT column1 FROM t2 ); |
子查询外部的语句可以是INSERT / UPDATE / DELETE / SELECT 的任何一个。
2). 分类
根据子查询结果不同,分为:
- A. 标量子查询(子查询结果为单个值)
- B. 列子查询(子查询结果为一列)
- C. 行子查询(子查询结果为一行)
- D. 表子查询(子查询结果为多行多列)
根据子查询位置,分为: - A. WHERE之后
- B. FROM之后
- C. SELECT之后
标量子查询
子查询返回的结果是单个值(数字、字符串、日期等),最简单的形式,这种子查询称为标量子查询。
常用的操作符:= <> > >= < <=
案例:
A. 查询 “销售部” 的所有员工信息
完成这个需求时,我们可以将需求分解为两步:
①. 查询 “销售部” 部门ID
1 | select id from dept where name = '销售部'; |
②. 根据 “销售部” 部门ID, 查询员工信息
1 | select * from emp where dept_id = (select id from dept where name = '销售部'); |
B. 查询在 “方东白” 入职之后的员工信息
完成这个需求时,我们可以将需求分解为两步:
①. 查询 方东白 的入职日期
1 | select entrydate from emp where name = '方东白'; |
②. 查询指定入职日期之后入职的员工信息
1 | select * from emp where entrydate > (select entrydate from emp where name = '方东白'); |
列子查询
子查询返回的结果是一列(可以是多行),这种子查询称为列子查询。
常用的操作符:IN
、NOT IN
、 ANY
、SOME
、 ALL
操作符 | 描述 |
---|---|
IN | 在指定的集合范围之内,多选一 |
NOT IN | 不在指定的集合范围之内 |
ANY | 子查询返回列表中,有任意一个满足即可 |
SOME | 与ANY等同,使用SOME的地方都可以使用ANY |
ALL | 子查询返回列表的所有值都必须满足 |
案例:
A. 查询 “销售部” 和 “市场部” 的所有员工信息
分解为以下两步:
①. 查询 “销售部” 和 “市场部” 的部门ID
1 | select id from dept where name = '销售部' or name = '市场部'; |
②. 根据部门ID, 查询员工信息
1 | select * from emp where dept_id in (select id from dept where name = '销售部' or name = '市场部'); |
B. 查询比 财务部 所有人工资都高的员工信息
分解为以下两步:
①. 查询所有 财务部 人员工资
1 | select id from dept where name = '财务部'; |
②. 比 财务部 所有人工资都高的员工信息
1 | select * from emp where salary > all ( select salary from emp where dept_id = (select id from dept where name = '财务部') ); |
C. 查询比研发部其中任意一人工资高的员工信息
分解为以下两步:
①. 查询研发部所有人工资
1 | select salary from emp where dept_id = (select id from dept where name = '研发部'); |
②. 比研发部其中任意一人工资高的员工信息
1 | select * from emp where salary > any ( select salary from emp where dept_id = (select id from dept where name = '研发部') ); |
行子查询
子查询返回的结果是一行(可以是多列),这种子查询称为行子查询。
常用的操作符:= 、<> 、IN 、NOT IN
案例:
A. 查询与 “张无忌” 的薪资及直属领导相同的员工信息 ;
这个需求同样可以拆解为两步进行:
①. 查询 “张无忌” 的薪资及直属领导
1 | select salary, managerid from emp where name = '张无忌'; |
②. 查询与 “张无忌” 的薪资及直属领导相同的员工信息 ;
1 | select * from emp where (salary,managerid) = (select salary, managerid from emp where name = '张无忌'); |
表子查询
子查询返回的结果是多行多列,这种子查询称为表子查询。
常用的操作符:IN
案例:
A. 查询与 “鹿杖客” , “宋远桥” 的职位和薪资相同的员工信息
分解为两步执行:
①. 查询 “鹿杖客” , “宋远桥” 的职位和薪资
1 | select job, salary from emp where name = '鹿杖客' or name = '宋远桥'; |
②. 查询与 “鹿杖客” , “宋远桥” 的职位和薪资相同的员工信息
1 | select * from emp where (job,salary) in ( select job, salary from emp where name = '鹿杖客' or name = '宋远桥' ); |
B. 查询入职日期是 “2006-01-01” 之后的员工信息 , 及其部门信息
分解为两步执行:
①. 入职日期是 “2006-01-01” 之后的员工信息
1 | select * from emp where entrydate > '2006-01-01'; |
②. 查询这部分员工, 对应的部门信息;
1 | select e.*, d.* from (select * from emp where entrydate > '2006-01-01') e left join dept d on e.dept_id = d.id ; |
多表查询案例
数据环境准备:
1 | CREATE TABLE salgrade ( grade INT, losal INT, hisal INT ) COMMENT '薪资等级表'; |
在这个案例中,我们主要运用上面所讲解的多表查询的语法,完成以下的12个需求即可,而这里主要涉及到的表就三张:emp员工表、dept部门表、salgrade薪资等级表 。
1). 查询员工的姓名、年龄、职位、部门信息 (隐式内连接)
表: emp , dept
连接条件: emp.dept_id = dept.id
1 | select e.name , e.age , e.job , d.name from emp e , dept d where e.dept_id = d.id; |
2). 查询年龄小于30岁的员工的姓名、年龄、职位、部门信息(显式内连接)
表: emp
, dept
连接条件: emp.dept_id = dept.id
1 | select e.name , e.age , e.job , d.name from emp e inner join dept d on e.dept_id = d.id where e.age < 30; |
3). 查询拥有员工的部门ID、部门名称
表: emp
, dept
连接条件: emp.dept_id = dept.id
1 | select distinct d.id , d.name from emp e , dept d where e.dept_id = d.id; |
4). 查询所有年龄大于40岁的员工, 及其归属的部门名称; 如果员工没有分配部门, 也需要展示出来(外连接)
表: emp
, dept
连接条件: emp.dept_id = dept.id
1 | select e.*, d.name from emp e left join dept d on e.dept_id = d.id where e.age > 40 ; |
5). 查询所有员工的工资等级
表: emp
, salgrade
连接条件 : emp.salary >= salgrade.losal and emp.salary <= salgrade.hisal
1 | -- 方式一 |
6). 查询 “研发部” 所有员工的信息及 工资等级
表: emp
, salgrade
, dept
连接条件 : emp.salary between salgrade.losal and salgrade.hisal
,emp.dept_id = dept.id
查询条件 : dept.name = '研发部'
1 | select e.* , s.grade from emp e , dept d , salgrade s where e.dept_id = d.id and ( e.salary between s.losal and s.hisal ) and d.name = '研发部'; |
7). 查询 “研发部” 员工的平均工资
表: emp
, dept
连接条件 : emp.dept_id = dept.id
1 | select avg(e.salary) from emp e, dept d where e.dept_id = d.id and d.name = '研发部'; |
8). 查询工资比 “灭绝” 高的员工信息。
①. 查询 “灭绝” 的薪资
1 | select salary from emp where name = '灭绝'; |
②. 查询比她工资高的员工数据
1 | select * from emp where salary > ( select salary from emp where name = '灭绝' ); |
9). 查询比平均薪资高的员工信息
①. 查询员工的平均薪资
1 | select avg(salary) from emp; |
②. 查询比平均薪资高的员工信息
1 | select * from emp where salary > ( select avg(salary) from emp ); |
10). 查询低于本部门平均工资的员工信息
①. 查询指定部门平均薪资
1 | select avg(e1.salary) from emp e1 where e1.dept_id = 1; |
②. 查询低于本部门平均工资的员工信息
1 | select * from emp e2 where e2.salary < ( select avg(e1.salary) from emp e1 where e1.dept_id = e2.dept_id ); |
11). 查询所有的部门信息, 并统计部门的员工人数
1 | select d.id, d.name , ( select count(*) from emp e where e.dept_id = d.id ) '人数' from dept d; |
12). 查询所有学生的选课情况, 展示出学生名称, 学号, 课程名称
表: student
, course
, student_course
连接条件: student.id = student_course.studentid , course.id = student_course.courseid
1 | select s.name , s.no , c.name from student s , student_course sc , course c where s.id = sc.studentid and sc.courseid = c.id ; |
以上需求的实现方式可能会很多,
SQL
写法也有很多,只要能满足我们的需求,查询出符合条件的记录即可。