基于 MySQL 的数据库实践(基本查询)
首先根据准备工作中的操作导入大学模式,打开数据库连接后进入到 MySQL 的交互界面,再使用命令 use db-book; 切换到 db-book 数据库。
单关系查询
SQL 查询的基本结构由三个子句构成,select,from 和 where,查询的输入是 from 子句中列出的关系,在这些关系上进行 where 和 select 子句指定的运算,然后产生一个关系作为结果,即 SQL 查询的结果是一个关系,这点很重要。
先考虑一个简单的查询,找出所有教师的名字,教师的名字可以在 instructor 关系中找到,这样我们 from instructor 来查询;教师的名字出现在 name 属性中,这样我们使用 select name 子句,综合起来就是下面的查询。
mysql> select name
-> from instructor;
+------------+
| name |
+------------+
| Srinivasan |
| Wu |
| Mozart |
| Einstein |
| El Said |
| Gold |
| Katz |
| Califieri |
| Singh |
| Crick |
| Brandt |
| Kim |
+------------+
12 rows in set (0.01 sec)
现在考虑另一个查询,找出所有教师所在的系名。
mysql> select dept_name
-> from instructor;
+------------+
| dept_name |
+------------+
| Biology |
| Comp. Sci. |
| Comp. Sci. |
| Comp. Sci. |
| Elec. Eng. |
| Finance |
| Finance |
| History |
| History |
| Music |
| Physics |
| Physics |
+------------+
12 rows in set (0.00 sec)
注意到 Comp. Sci. 等行出现了不止一次,这是因为一个系可能有多个教师。
在关系模型的形式化数学定义中,关系是一个集合,因此关系中不包含重复的元素。但在实践中,有时我们希望保留重复,更关键的事,去掉重复是消耗较大的,因此 SQL 默认在关系以及 SQL 表达式结果中允许出现重复。
如果我们想要去掉重复,可以在 select 后加入关键字 distinct,也就是像下面这样。
mysql> select distinct dept_name
-> from instructor;
+------------+
| dept_name |
+------------+
| Biology |
| Comp. Sci. |
| Elec. Eng. |
| Finance |
| History |
| Music |
| Physics |
+------------+
7 rows in set (0.01 sec)
完整地说,SQL 支持使用关键字 all 来显式指明不去掉重复,但因为标准默认的行为即保留重复元组,因此不使用 all 才是更符合习惯的写法。
select 子句还可带含有四则运算运算符的表达式,运算对象可以是常数或元组的属性,这一点对应关系代数运算中的广义投影,看下面的查询。
mysql> select ID, name, dept_name, salary * 1.1
-> from instructor;
+-------+------------+------------+--------------+
| ID | name | dept_name | salary * 1.1 |
+-------+------------+------------+--------------+
| 10101 | Srinivasan | Comp. Sci. | 71500.000 |
| 12121 | Wu | Finance | 99000.000 |
| 15151 | Mozart | Music | 44000.000 |
| 22222 | Einstein | Physics | 104500.000 |
| 32343 | El Said | History | 66000.000 |
| 33456 | Gold | Physics | 95700.000 |
| 45565 | Katz | Comp. Sci. | 82500.000 |
| 58583 | Califieri | History | 68200.000 |
| 76543 | Singh | Finance | 88000.000 |
| 76766 | Crick | Biology | 79200.000 |
| 83821 | Brandt | Comp. Sci. | 101200.000 |
| 98345 | Kim | Elec. Eng. | 88000.000 |
+-------+------------+------------+--------------+
12 rows in set (0.00 sec)
这个查询,如上所示,返回一个与 instructor 一样的关系,除了属性 salary 的值是原来的 1.1 倍,查询的语义是为每位教师增长 10% 的工资的结果,注意这并不修改 instructor 关系,而是返回了一个新的关系。
where 子句允许我们只选出那些在 from 子句的结果关系中满足特定谓词的元组。
考虑查询,找出所有在 Computer Science 系并且工资超过 70000 美元的教师的姓名。我们可以使用 where 子句写出下面的查询。
mysql> select name
-> from instructor
-> where dept_name = 'Comp. Sci.' and salary > 70000;
+--------+
| name |
+--------+
| Katz |
| Brandt |
+--------+
2 rows in set (0.01 sec)
SQL 允许在 where 子句中使用逻辑连词 and,or 和 not,逻辑连词的运算对象可以是包含比较运算符的表达式。注意相等用 = 表示,不相等用 <> 表示。
多关系查询
上面的查询都是基于单个关系的,但是通常我们的查询需要从多个关系中获取信息。
考虑查询,找出所有教师的姓名,以及他们所在的系的名称和系所在的建筑物的名称。考虑 instructor 关系的模式,我们可以从 dept_name 属性得到系名,但是系所在的建筑物的名称记录在 department 关系的 building 属性中,为了回答查询,instructor 关系中的每个元组必须与 department 关系中的元组匹配,后者在 dept_name 上的取值等于 instructor 元组在 dept_name 上的取值。有了这样的思路,我们可以尝试写对应的 SQL 查询。
mysql> select name, instructor.dept_name, building
-> from instructor, department
-> where instructor.dept_name = department.dept_name;
+------------+------------+----------+
| name | dept_name | building |
+------------+------------+----------+
| Crick | Biology | Watson |
| Srinivasan | Comp. Sci. | Taylor |
| Katz | Comp. Sci. | Taylor |
| Brandt | Comp. Sci. | Taylor |
| Kim | Elec. Eng. | Taylor |
| Wu | Finance | Painter |
| Singh | Finance | Painter |
| El Said | History | Painter |
| Califieri | History | Painter |
| Mozart | Music | Packard |
| Einstein | Physics | Watson |
| Gold | Physics | Watson |
+------------+------------+----------+
12 rows in set (0.00 sec)
注意 dept_name 属性既出现在 instructor 关系中,也出现在 department 关系中,关系名作为前缀可以说明我们指的是哪一个属性,与之相反,name 属性和 building 属性只出现在一个关系中,因而不需要把关系名作为前缀。这种命名惯例的使用,要求出现在 from 子句中的关系具有可区分的名字,在某些情况下这样的要求达不到,例如当需要组合来自同一个关系的两个不同元组的信息的时候,对于这种情况,在后面我们会提到可以用更名(rename)运算来处理。
再考虑一个查询,找出 Computer Science 系的教师名字和教授的课程标识
mysql> select name, course_id
-> from instructor, teaches
-> where instructor.ID = teaches.ID and dept_name = 'Comp. Sci.';
+------------+-----------+
| name | course_id |
+------------+-----------+
| Srinivasan | CS-101 |
| Srinivasan | CS-315 |
| Srinivasan | CS-347 |
| Katz | CS-101 |
| Katz | CS-319 |
| Brandt | CS-190 |
| Brandt | CS-190 |
| Brandt | CS-319 |
+------------+-----------+
8 rows in set (0.00 sec)
这里 dept_name 只出现在 instructor 关系中,因此不必要写 instructor.dept_name。
通常说来,一个 SQL 查询的含义可以这么理解:
1.按照 from 子句中列出的关系产生笛卡尔积
2.在步骤 1 的结果上应用 where 子句指定的谓词筛选
3.在步骤 2 的结果上输出 select 子句指定的属性或表达式的结果
注意这是逻辑上的执行方式,实际执行会有较多的优化方式,例如尽可能地不产生一个庞大的笛卡尔积,而是只产生满足 where 子句的笛卡尔积元素。