
关系代数基于集合(关系),定义了一系列对集合(关系)对 *** 作。如并,差,笛卡尔积,选择,更名,投影等基本 *** 作,以及基于基本 *** 作推导出来的扩展 *** 作。
关系代数作用于一个或多个关系,然后产生一个新的关系。可以将关系代数理解为函数,接受一个关系输入,返回一个新对关系。举个例子,我们将并 *** 作命名为 Union ,那么并 *** 作可以表示为:
对于其他对 *** 作如差 *** 作,选择 *** 作等,都有相应对数学符号进行表示,但在中输入这些符号比较困难,再加上我学习关系代数是了解基本的概念知识,这里就不使用数学符号表示了,而是以文字代替。
关系代数定义了基于集合(关系)的 *** 作,其是 SQL 的重要基础(另一个重要基础是关系演算),了解了关系代数的概念以及各个 *** 作要达到的目的之后,对 SQL 中对一些概念也会更加清晰,如连接 *** 作。
本文首先介绍关系代数中的基础 *** 作,再介绍扩展 *** 作。
关系代数的基础 *** 作有:并,差,笛卡尔积,选择,更名,投影等。有些 *** 作如并,差等要求参与运算的关系需要具备并相容性。所谓并相容性,就是两个关系的属性数目(度)相同,并且每个度所在的域相同。
如 R(学生,学号,地址) 和 S(课程,课程号) 两个关系由于度和属性所在的域不相同,因此不具备并相容性,也就无法进行并,差等 *** 作。
相应的, R2(学生,学号,地址) 和 S(教师,教师号,地址) 由于度和属性所在的域相同,因此具备并相容性。
并 *** 作就是将两个关系合并为一个关系,在合并时去掉重复的元组。为什么要去掉重复项呢?这是集合的特质,集合要求不能有重复项。
R 并 S 和 S 并 R 得到的结果是一样的,即并 *** 作满足交换律。
举个例子,有两个关系 R(学生) 和 S(教师):
这两个关系进行并 *** 作的结果为:
差 *** 作用来选择出现在一个关系但并未出在另一个关系中的元组。
还是以上面两个关系 R(学生) 和 S(教师) 为例,R 差 S 的结果为:
S 差 R 的结果为:
其中元组 T(Jerry,2,澳大利亚) 在两个关系中都出现,是两个关系的交集。因此差 *** 作就是从一个关系中去除和另一个关系的交集所得到的集合。
差 *** 作不满足交换律。
笛卡尔积用来将两个关系连接起来,笛卡尔积的结果将两个关系中所有可能的元组组合起来。假设关系 R 的元组数目为 M,度数为 I,关系 S 的元组数目为 N,度数为 J,那么 R 和 S 进行笛卡尔积运算得到的新关系的元组数目为 M N,度数为 I + J。
举个例子,有两个关系 R(学生) 和 S(课程) :
那么对 R 和 S 进行笛卡尔积的结果为:
笛卡尔积用来将两个关系连接在一起,获取所有可能的结果,其是连接 *** 作的基础。
选择 *** 作就是从一个关系中,选择出满足条件的元组。
如从上面的学生表中,选择出学号大于等于 2 的学生,结果为:
选择条件由与或非逻辑表达式构成。
投影 *** 作是从给定的关系中,选择出某些属性属性构成新的关系。如从学生表中投影出一个新的关系 R(姓名,地址) :
关系代数常用的扩展 *** 作有交 *** 作,Theta 连接 *** 作,自然连接 *** 作,外连接 *** 作,除 *** 作等。扩展 *** 作可以由基础 *** 作推导而来。
交 *** 作用来从两个关系中,选择出同时存在于两个关系中的元组。如上面 R(学生) 和 S(教师) 进行交 *** 作的结果为:
Theta 连接 *** 作会从两个关系的笛卡尔积中,选择出某个条件的元组,并去掉重复项。例如在上面笛卡尔积例子,选择出课程号不为 c1 并且学号不为 s1 的元组:
连接 *** 作一般和投影 *** 作配合使用,比如从上面的结果集中投影出 R(姓名,课程) :
Theta 连接 *** 作中有个特殊的 *** 作,叫做等值连接,即选择条件为判断是否相等。
自然连接可以认为是一种特殊的等值连接,其要求两个关系具有相同的属性,并且判断条件为两个关系中的某两个相同属性的值相等。
自然连接是最常用的连接 *** 作。
假如有两个关系 R(学生 ) 和 S(班级) :
对这两个关系进行自然连接的结果为:
外连接就是在自然连接的结果集中,将空值元组和没有匹配到的元素放入到结果集中。
假如有两个关系 R(学生 ) 和 S(班级) :
首先对这两个关系进行自然连接:
我们在自然连接的结果集中,机上空值元组和没有匹配到的元组:
以上就是外连接的结果,也叫做全外连接:保证两端的元素不丢失。对应的,还有左外连接和右外连接,左外连接会保证左侧的元素不丢失,右外连接会保证右侧的元素不丢失。
因此上面两个进行左外连接的结果为:
进行右外连接的结果为:
除 *** 作是对两个关系进行“除法” *** 作,要求“除数”关系是“被除数”关系的真子集。除 *** 作会从“被除数”关系中,选择出一个新的关系,设为 N,N 也是 “被除数”关系的真子集。N 需要满足一个条件:
N 和“除数”关系的笛卡尔积是“被除数”关系的最大真子集。
好绕啊···
我们还是直接看例子吧。
假设有两个关系: R(A1,A2,A3) 和 S(A3) :
对 R 和 S 进行除 *** 作,得到的结果为:
如果 S 关系为:
那么对 R 和 S 进行除 *** 作的结果为:
从上面的例子来看,除 *** 作适用于“满足全部····”的查询。举个例子,从学生表中查询选择了所有课程或者选择了软件测试和软件工程这两门课程的学生。
假设存在一个关系 R(学生) 和 S(课程) :
现在我们要查询选择了软件测试这门课的所有学生,则被除数关系为 R(学生) ,除数关系为:
对两个关系进行除 *** 作,得到的结果为:
如果我们只需要获取学生的姓名,不需要学号这一列,那么可以再对结果集进行投影 *** 作:
本文介绍了关系代数以及关系代数中常用的基础 *** 作和扩展 *** 作,基础 *** 作包括并,差,笛卡尔积,选择,投影,更名等,某些基础要做要求两个参与运算的关系具有并相容性。扩展 *** 作可以由基础 *** 作推导而来,可以完成更复杂的 *** 作。
关系代数是 SQL 语言的基础,SQL 语言是在关系代数上的一层封装,目的是方便程序员使用。
关系代数的 *** 作接受一个或多个关系作为输入,再输出一个新的关系,不同的关系 *** 作可以进行相互的组合。例如可以先进行选择 *** 作再进行投影 *** 作,先进行自然连接 *** 作再进行选择 *** 作等等。根据不同的需求需要灵活的组合这些 *** 作。
完。
数据库查询分为 单表查询、连接查询、嵌套查询、集合查询
其中连接查询指涉及两个及以上表的查询,有等值连接、非等值连接、自然连接、自身连接、外连接五种
等值连接和非等值连接指where子句的查询条件(由比较运算符连接起来的条件,比较运算符有= >= <= > < != 等)比如:
select student,sc from student,sc where studentsno=scsno
自身连接是对本身表的连接,即内连接,即给自己取一个别名,当作两张表使用
如查询每一们课的间接先修课
select firstcno,secondcpno from course first ,course second where firstcpno=secondcno
(其中cno为课程号,cpno为先修课号)
外连接为连接信息不全时使用,增加一个万能行,比如学生95003没有选课,那么在选课表(sc)中就没有相应的元组,但是我们想从student表为主体列出每个学生的基本情况及选课情况,若没个学生没有选课,只输出其基本情况,选课信息为空即可,这是就要用到外连接,比如:
select student,sccno,scgrade from studentsc
where studentsno=scsno();
其中scsno() 中的号就是右连接,若号出现在左边,就为左连接
自然连接指在广义笛卡儿积中去掉重复属性列的连接
具体资料请参阅一些数据库书籍:)
1、如图所示,打开了SQL Server 2008,并创建好了数据库。然后看当前是否是在自己要创建表的数据库中。
2、如图,选中好LX数据库,练习数据库。
3、或者在新建窗口中输入代码,USE LX,然后选中后运行它,一样进入到LX数据库中。如图所示。
4、之前有教过不用代码设计数据库的表,这里只讲用语句创建表。如图所示,创建表的代码格式如下。
5、创建一个员工表的实际代码,如图所示,简单的员工表,有员工号、员工姓名、员工所在部门构成。
6、接着,输入好代码后,设置一些主外键约束。
本篇文章继续围绕SQL的语法重点为大家介绍 连接 和 高级连接 的使用,以及 使用连接的注意事项 。
SQL最强大的功能之一就是能在数据查询的执行中 连接(join)表 。连接是利用SQL的SELECT语句能执行的最重要的 *** 作,很好地理解连接及其语法是学习SQL的极为重要的一点。在能够有效地使用连接前,我们必须了解 关系表 以及 关系数据库 设计的一些基础知识。下面的介绍并不能涵盖这一主题的所有内容,但作为入门已经够了。
连接
理解关系表,最好是来看个例子。
有一个包含产品目录的数据库表,其中每类物品占一行。
对于每一种物品,要存储的信息包括产品描述、价格,以及生产该产品的供应商。
现在有同一供应商生产的多种物品,那么在何处存储供应商名、地址、联系方法等供应商信息呢?将这些数据与产品信息分开存储的理由是:
① 同一供应商生产的每个产品,其供应商信息都是相同的,对每个产品重复此信息既浪费时间又浪费存储空间;
② 如果供应商信息发生变化,例如供应商迁址或电话号码变动,只需修改一次即可;
③ 如果有重复数据(即每种产品都存储供应商信息),则很难保证每次输入该数据的方式都相同。不一致的数据在报表中就很难利用。
关键是, 相同的数据出现多次不是一件好事 ,这是关系数据库设计的基础。
关系表的设计就是要 把信息分解成多个表 , 一类数据一个表 。各表通过某些共同的值互相关联(所以才叫关系数据库)。在这个例子中可建立两个表:一个存储供应商信息,另一个存储产品信息。Vendors表包含所有供应商信息,每个供应商占一行,具有唯一的标识。此标识称为 主键 (primary key),可以是供应商ID或任何其他唯一值。Products表只存储产品信息,除了存储供应商ID(Vendors表的主键)外,它不存储其他有关供应商的信息。Vendors表的主键将Vendors表与Products表关联,利用供应商ID能从Vendors表中找出相应供应商的详细信息。
这样做的 好处 是:
① 供应商信息不重复,不会浪费时间和空间;
② 如果供应商信息变动,可以只更新Vendors表中的单个记录,相关表中的数据不用改动;
③ 由于数据不重复,使得处理数据和生成报表更简单。
总之,关系数据可以有效地存储,方便地处理。因此,关系数据库的可伸缩性远比非关系数据库要好。
为什么使用连接
连接将数据分解为多个表实现 更有效 地存储、 更方便 地处理,且 可伸缩性更好 。
可伸缩性:能够适应不断增加的工作量而不失败。
连接作为一种机制,能在一条SELECT语句中用来关联表。使用特定的语法,可连接多个表返回一组输出。
创建连接
分析 :上述SELECT语句中与之前的语句相同,都是指定检索的列, 区别 在于该语句指定的两列(prod_name,prod_price)在一个表中,而第一列(vend_name)在另一个表中。
FROM子句也有所区别。该FROM子句列出了两个表:Vendors,Products。这两个表由SELECT语句的WHERE子句连接。WHERE子句指示DBMS将Vendors表中的vend_id与Products表中的vend_id匹配起来。
这里使用了 完全限定列名 将Vendorsvend_id和Productsvend_id两列匹配。最终输出了两个不同表中的数据。
高级连接部分将介绍 如何使用表别名,另外的一些连接 ,以及 如何对被连接的表使用聚集函数 。
使用表别名
之前的文章已经给大家介绍了如何使用别名引用被检索的表列。
SQL还可以 给表名起别名 ,目的是:
① 缩短SQL语句。
② 允许在一条SELECT语句中多次使用相同的表。
分析 :上述语句中的FROM子句的三个表都有别名。如此 省略了许多字符 。表别名还可以用于SELECT的列表、ORDER BY子句以及其他语句部分。
需要注意的是: 表别名只在查询执行中使用 。与列别名不同,表别名不返回到客户端。
使用不同类型的连接
接下来将给大家介绍四种其他类型的连接: 自连接 、 自然连接 、 内连接 和 外连接 。
①自连接
分析: 这是使用了 子查询 的方案。对内部的SELECT语句做了一个简单的检索,返回Jim Jones工作公司的cust_name。该数据用于外部查询的WHERE子句中,以检索出为该公司工作的所有雇员。
下面看看使用了 连接 的方案。
分析:上述语句需要的两个表实际上是相同的表,所以Customers表在FROM子句中出现了两次。但这对于Customers的引用具有歧义,因为没有指示DBMS引用的是哪个Customers表。
于是需要使用表别名解决该问题。Customers表 第一次出现为别名c1 , 第二次为c2 ,然后再将这些别名用作表名。如SELECT语句使用c1前缀明确给出所需列的全名。如果不这么做,DBMS将返回错误,因为名为cust_id、cust_name、cust_contact的列各有两个。DBMS不知需要哪一列,即使它们都是同一列。
WHERE首先连接两个表,再按第二个表中的cust_contact过滤数据,返回所需的数据。
②自然连接
内连接 返回所有的数据,其中 相同的列可多次出现 。而 自然连接排除多次出现 ,使每一列只返回一次。
一般通过对一个表使用通配符(SELECT ),而对其他的列使用明确的子集来实现自然连接。
分析: 上述语句中,通配符只对第一个表使用,而所有其他列都明确列出来,所以没有出现重复的列被检索出来。
③内连接
目前为止使用的连接称为等值连接,是基于两个表之间的相等测试。该连接也称为内连接。
对该种连接还可以使用不同的语法,明确指定连接的类型。
分析 :该语句中的SELECT与之前的区别在于FROM 子句。此处两个表之间的关系是以 INNER JOIN 指定的部分FROM子句,因此需要使用特定的 ON子句 而不是WHERE子句。但传递给ON的实际条件与WHERE相同。
④外连接
许多连接将一个表中的行与另一个表中的行相关联,但有时候 需要包含没有关联的行 。例如,可能需要使用连接完成以下工作:
对每个顾客下的订单进行计数,包括那些至今尚未下订单的顾客;
列出所有产品以及订购数量,包括没有人订购的产品;
计算平均销售规模,包括那些至今尚未下订单的顾客。
在上述例子中,连接包含了那些在相关表中没有关联行的行。这种连接称为外连接,外连接分为 左外连接 和 右外连接 。
左外连接:取左边的表的全部,而右边的表按照条件显示,不符合条件的显示NULL。
右外连接:取右边的表的全部,而左边的表按照条件显示,不符合条件的显示NULL。
下面先给出一个简单的 内连接 ,再给出 左外连接 ,大家对比着理解。
分析 :两个语句都使用了 JOIN 关键字来指定连接类型,与内连接不同的是,左外连接包括没有关联行的行。因此在使用JOIN语法时,还需使用RIGHT或LEFT关键字来指定包括其所有行的表(RIGHT指出的是OUTER JOIN右边的表,而LEFT指出的是OUTER JOIN左边的表)。
上述左外连接语句使用了LEFT OUTER JOIN 从FROM子句左边的表(Customers)中选择所有行。
若要从右边的表选择所有行,即使用 右外连接 ,则语句如下:
注意 :两种基本的外连接形式,左外连接和右外连接。两者的唯一差别是所关联的表的顺序。
此外,还有一种外连接,即 全外连接 。该连接检索两个表中的所有行并关联可关联的行。与左外连接或右外连接包含一个表的不关联的行不同,全外连接包含两个表的不关联的行。
自连接、自然连接、内连接和外连接的区别
①自连接: 通常用于 两张结构和数据内容完全一样的表 ,在做数据处理时,对它们分别 重命名 来加以区分,然后再进行关联。
②自然连接 :特点是要求两个关系表中进行连接的必须是 相同属性列 (名字相同),无需添加连接条件,且 在结果中消除了重复的属性列 。
③内连接 :与自然连接相似,区别在于内连接 不要求两属性列同名 ,可以用 using或on 来指定某两列字段相同的连接条件。
④外连接 :可以解决自然连接时某些属性不同导致这些元组被舍弃的问题,起到了 保留要舍弃的结果 的作用。
使用带聚集函数的连接
之前给大家介绍过使用 聚集函数 来汇总数据,殊不知这些函数也可以与连接一起使用。
分析: 上述语句使用了 COUNT函数 。该语句使用INNER JOIN将Customers和Orders表相互关联。GROUP BY子句按顾客分组,因此,函数调用COUNT(Ordersorder_num)对每个顾客的订单计数,将其作为num_ord返回。
分析: 上述语句使用 左外连接 包含所有顾客,包括了那些没有任何订单的顾客。
WHERE子句的重要性
需记住的是,在一条SELECT语句中连接几个表时,相应的关系是在运行中构造的,因为在数据库表中的定义没有指示DBMS如何对表进行连接的内容。
要连接多个表,需要将它们并列于from之后, 关键 是要设置WHERE子句,确保它们之间的 关联关系 必须给出,否则,查询结果会成为笛卡尔积。
笛卡尔积:由没有连接条件的表关系返回的结果为笛卡儿积。
分析 :上述语句输出的结果便是 笛卡尔积 。返回的数据用每个供应商匹配了每个产品,包括了供应商不正确的产品(即使该供应商没有产品)。
连接及其使用的要点
① 注意所使用的连接类型。一般我们使用内连接,但使用外连接也有效。
② 关于确切的连接语法,应该查看具体的文档,看相应的DBMS支持何种语法(大多数DBMS使用这两课中描述的某种语法)。
③ 保证使用正确的连接条件(不管采用哪种语法),否则会返回不正确的数据。
④ 应该总是提供连接条件,否则会得出笛卡儿积。
⑤ 在一个连接中可以包含多个表,甚至可以对每个连接采用不同的连接类型。虽然这样做是合法的,一般也很有用,但应该在测试它们前分别测试每个连接。这会使故障排除更为简单。
以上就是本次介绍的连接和高级连接啦~
下一期将给大家介绍 组合查询 、 插入数据 及 更新和删除数据。
我们下期见!
连接可以在SELECT 语句的FROM子句或WHERE子句中建立,似是而非在FROM子句中指出连接时有助于将连接 *** 作与WHERE子句中的搜索条件区分开来。所以,在Transact-SQL中推荐使用这种方法。
SQL-92标准所定义的FROM子句的连接语法格式为:
FROM join_table join_type join_table
[ON (join_condition)]
其中join_table指出参与连接 *** 作的表名,连接可以对同一个表 *** 作,也可以对多表 *** 作,对同一个表 *** 作的连接又称做自连接。
join_type 指出连接类型,可分为三种:内连接、外连接和交叉连接。
内连接(INNER JOIN)使用比较运算符进行表间某(些)列数据的比较 *** 作,并列出这些表中与连接条件相匹配的数据行。根据所使用的比较方式不同,内连接又分为等值连接、自然连接和不等连接三种。
外连接分为左外连接(LEFT OUTER JOIN或LEFT JOIN)、右外连接(RIGHT OUTER JOIN或RIGHT JOIN)和全外连接(FULL OUTER JOIN或FULL JOIN)三种。与内连接不同的是,外连接不只列出与连接条件相匹配的行,而是列出左表(左外连接时)、右表(右外连接时)或两个表(全外连接时)中所有符合搜索条件的数据行。
交叉连接(CROSS JOIN)没有WHERE 子句,它返回连接表中所有数据行的笛卡尔积,其结果集合中的数据行数等于第一个表中符合查询条件的数据行数乘以第二个表中符合查询条件的数据行数。
连接 *** 作中的ON (join_condition) 子句指出连接条件,它由被连接表中的列和比较运算符、逻辑运算符等构成。
无论哪种连接都不能对text、ntext和image数据类型列进行直接连接,但可以对这三种列进行间接连接。例如:
SELECT p1pub_id,p2pub_id,p1pr_info
FROM pub_info AS p1 INNER JOIN pub_info AS p2
ON DATALENGTH(p1pr_info)=DATALENGTH(p2pr_info)
(一)内连接
内连接查询 *** 作列出与连接条件匹配的数据行,它使用比较运算符比较被连接列的列值。内连接分三种:
1、等值连接:在连接条件中使用等于号(=)运算符比较被连接列的列值,其查询结果中列出被连接表中的所有列,包括其中的重复列。
2、不等连接: 在连接条件使用除等于运算符以外的其它比较运算符比较被连接的列的列值。这些运算符包括>、>=、<=、<、!>、!<和<>。
3、自然连接:在连接条件中使用等于(=)运算符比较被连接列的列值,但它使用选择列表指出查询结果集合中所包括的列,并删除连接表中的重复列。
例,下面使用等值连接列出authors和publishers表中位于同一城市的作者和出版社:
SELECT
FROM authors AS a INNER JOIN publishers AS p
ON acity=pcity
又如使用自然连接,在选择列表中删除authors 和publishers 表中重复列(city和state):
SELECT a,ppub_id,ppub_name,pcountry
FROM authors AS a INNER JOIN publishers AS p
ON acity=pcity
(二)外连接
内连接时,返回查询结果集合中的仅是符合查询条件( WHERE 搜索条件或 HAVING 条件)和连接条件的行。而采用外连接时,它返回到查询结果集合中的不仅包含符合连接条件的行,而且还包括左表(左外连接时)、右表(右外连接时)或两个边接表(全外连接)中的所有数据行。
如下面使用左外连接将论坛内容和作者信息连接起来:
SELECT a,b FROM luntan LEFT JOIN usertable as b
ON ausername=busername
下面使用全外连接将city表中的所有作者以及user表中的所有作者,以及他们所在的城市:
SELECT a,b
FROM city as a FULL OUTER JOIN user as b
ON ausername=busername
左连接:(也叫左外连接,给出两个表的配匹行,并且以左边的表为准,如果左边表有而右边表没有的行,则在右边表的相应行选择的列显示为NULL,允许左边的基准表对应右边表多条满足条件的记录)左连接就是返回左边的匹配行,不考虑右边的表是否有相应的行,如:select field1,field2 from table1 left join table2
on field1=field2(基准字段,可以多个)
where table1field3=table2field3
右连接:(也叫右外连接,给出两个表的配匹行,并且以右边的表为准,如果右边表有而左边表没有的行,则在右边表的相应行选择的列显示为NULL,允许右边的基准表对应左边表多条满足条件的记录)
(三)交叉连接
交叉连接不带WHERE 子句,它返回被连接的两个表所有数据行的笛卡尔积,返回到结果集合中的数据行数等于第一个表中符合查询条件的数据行数乘以第二个表中符合查询条件的数据行数。
例,titles表中有6类图书,而publishers表中有8家出版社,则下列交叉连接检索到的记录数将等于68=48行。
SELECT type,pub_name
FROM titles CROSS JOIN publishers
ORDER BY
TABLE
A
;TABLE
B
内连接:A
INNER
JOIN
B
,在A中也有,在B中也有的数据才能查询出来
左连接:A
LEFT
JOIN
B,连接查询的数据,在A中必须有,在B中可以有可以没有
右连接与左连接相反
以上就是关于数据库系统原理之关系代数全部的内容,包括:数据库系统原理之关系代数、什么是左连接、右连接和全连接、内连接、数据库SQL语句~四表连接等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)