第2章 关系模型.ppt
《第2章 关系模型.ppt》由会员分享,可在线阅读,更多相关《第2章 关系模型.ppt(106页珍藏版)》请在麦多课文档分享上搜索。
1、1,第2章 关系模型,2,上一章介绍了三种主要的数据模型: 层次模型 网状模型 关系模型 其中关系模型简单灵活,并有着坚实的理论基础,已成为当前最流行的数据模型。本章主要讲述: 关系模型的数据结构 关系的定义和性质 关系数据库的基本概念 关系运算,3,2.1 关系模型,关系模型就是用二维表格结构来表示实体及实体之间联系的模型。 关系模型是各个关系的框架的集合,即关系模型是一些表格的格式,其中包括关系名、属性名、关键字等。 例如,教学数据库中教师与课程的关系模型如图2.1所示。 教师关系课程关系C 授课关系SC图2.1 教师课程数据库的关系模型,4,从各个关系的框架中,我们可以很容易看出哪两个关
2、系之间有联系。例如: 教师关系和授课关系有公共的属性“教师号”,则表明这两个关系有联系。 而课程关系和授课关系有公共的属性“课程号”,则表明这两个关系也有联系。 至于元组之间的联系,则与具体的数据有关。只有在公共属性上具有相同属性值的元组之间才有联系。,5,由上例可以看出,在一个关系中可以存放两类信息: 一类是描述实体本身的信息 一类是描述实体(关系)之间的联系的信息 在层次模型和网状模型中,把有联系的实体(元组)用指针链接起来,实体之间的联系是通过指针来实现的。 而关系模型则采用不同的思想,即用二维表来表示实体与实体之间的联系,这就是关系模型的本质所在。 所以,在建立关系模型时,只要把的所有
3、的实体及其属性用关系框架来表示,同时把实体之间的关系也用关系框架来表示,就可以得到一个关系模型。 如上例中的教师课程数据库的关系模型就是这样建立的。,6,2.2 关系的定义,在关系模型中,数据是以二维表的形式存在的,这个二维表就叫做关系。 关系理论是以集合代数理论为基础的,因此,我们可以用集合代数给出二维表的“关系”定义。 为了从集合论的角度给出关系的定义,我们先引入域和笛卡尔积的概念。,7,2.2.1 域(Domain) 域是一组具有相同数据类型的值的集合,又称为值域。(用D表示) 例如整数、实数、字符串的集合。 域中所包含的值的个数称为域的基数(用m表示)。 关系中用域表示属性的取值范围。
4、例如: D1=李力,王平,刘伟 m1=3 D2=男,女 m2=2 D3=47,28,30 m3=3 其中,D1,D2,D3为域名,分别表示教师关系中姓名、性别、年龄的集合。 域名无排列次序,如D2=男,女=女,男,8,2.2.2 笛卡尔积(Cartesian Product) 给定一组域D1,D2,Dn(它们可以包含相同的元素,即可以完全不同,也可以部分或全部相同)。D1,D2,Dn的笛卡尔积为D1D2Dn=(d1,d2,dn)|diDi,i=1,2,n。 由定义可以看出,笛卡尔积也是一个集合。 其中: 1. 元素中的每一个di叫做一个分量(Component),来自相应的域(diDi) 2.
5、 每一个元素(d1,d2,d3,dn)叫做一个n元组(n-tuple),简称元组(Tuple)。但元组不是di的集合,元组的每个分量(di)是按序排列的。如: (1,2,3)(2,3,1)(1,3,2); 而集合中的元素是没有排序次序的,如(1,2,3)=(2,3,1)=(1,3,2)。,9,3. 若Di(i=1,2,n)为有限集,Di中的集合元素个数称为Di的基数,用mi(i=1,2,n)表示,则笛卡尔积D1D2Dn的基数M(即元素(d1,d2,dn)的个数)为所有域的基数的累乘之积,即M= 例如:上述表示教师关系中姓名、性别两个域的笛卡尔积为: D1D2=(李力,男),(李力,女),(王平
6、,男),(王平,女),(刘伟,男),(刘伟,女) 其中: 李力、王平、刘伟、男、女都是分量 (李力,男),(李力,女)等是元组 其基数M=m1m2=3*2=6 元组的个数为6,10,4. 笛卡尔积可用二维表的形式表示。 例如,上述的6个元组可表示成表2.1。表2.1 D1和D2的笛卡尔积 由上例可以看出,笛卡尔积实际是一个二维表,表的框架由域构成,表的任意一行就是一个元组,表中的每一列来自同一域,如第一个分量来自D1,第二个分量来自D2。,11,2.2.3 关系(Relation) 笛卡尔积D1D2Dn的任一子集称为定义在域D1,D2,Dn上的n元关系(Relation),可用R(D1,D2D
7、n)表示 如上例D1D2笛卡尔积的子集可以构成教师关系T1,如下表:,12,几点说明: 1. R为关系名,n称为关系的目或度(Degree)。 当n=1时,称为单元关系。 当n=2时,称为二元关系。 当n=n时,称为n元关系。 如上例为二元关系,关系名为T。,13,2. 该子集中的元素是关系中的元组,用r表示,关系中元组个数是关系的基数。如(李力,男),(王平,女),(刘伟,男)为三个元组,关系的基数为3。 如果一个关系的元组个数是无限的,则称为无限关系; 如果一个关系的元组个数是有限的,则称为有限关系。 由于计算机存储系统的限制,我们一般不去处理无限关系,而只考虑有限关系。 3. 同样可以把
8、关系看成一个二维表。其中, (1)表的框架由域Di(i=1,2,n)构成; (2)表的任意一行对应一个元组; (3)表的每一列来自同一域; (4)域可以相同,为了加以区别,每列起一个名字,称为属性,n目关系有n个属性,属性的名字唯一,属性的取值范围Di(i=1,2,n)称为值域 (5)具有相同关系框架的关系成为同类关系, 例如,有另一个关系T2,如表2.3所示:T1和T2是同类关系。,14,4. 数学上关系是笛卡尔积的任意子集,但在实际应用中关系是笛卡尔积中所取的有意义的子集。例如在表2.1中选取一个子集构成如下关系,显然不符合实际情况在关系模型中,关系可进一步定义为: 定义在域D1,D2,D
9、n(不要求完全相异)上的关系由关系头(Heading)和关系体(Body)组成。 关系头:由属性名A1,A2,An的集合组成,每个属性Ai正好对应一个域Di(i=1,2,n),关系头,也称关系框架,相对固定,是关系的数据结构的描述。 关系体:是指关系结构中的内容或者数据,并非固定不变,它随元组的建立、删除或修改而变化。,15,尽管关系与二维表格、传统的数据文件是非常类似的,但它们之间又有重要的区别。 严格地说,关系是种规范化了的二维表中行的集合,为了使相应的数据操作简化,在关系模型中,对关系作了种种限制,关系具有如下特性: 1. 关系中不允许出现相同的元组。因为数学上集合中没有相同的元素,而关
10、系是元组的集合,所以作为集合元素的元组应该是唯一的。 2. 关系中元组的顺序(即行序)是无关紧要的,在一个关系中可以任意交换两行的次序。因为集合中的元素是无序的,所以作为集合元素的元组也是无序的。根据关系的这个性质,可以改变元组的顺序使其具有某种排序,然后按照顺序查询数据,可以提高查询速度。,2.3 关系的性质,16,3. 关系中属性的顺序是无关紧要的,即列的顺序可以任意交换。交换时,应连同属性名一起交换,否则将得到不同的关系。 例如:关系T1作如下交换时,无任何影响,如下表所示:,17,而作如下交换时,不交换属性名,只交换属性列中的值,则得到不同的关系,如下表:,18,4. 同一属性名下的各
11、个属性值必须来自同一个域,是同一类型的数据。 5. 关系中各个属性必须有不同的名字,不同的属性可来自同一个域,即它们的分量可以取自同一个域。 例如,有如下表中关系,职业与兼职是两个不同的属性,但它们取自同一个域职业教师,工人,辅导员。,19,6. 关系中每一分量必须是不可分的数据项,或者说所有属性值都是原子的,即是一个确定的值,而不是值的集合。属性值可以为空值,表示“未知”或“不可使用”,即不可“表中有表”。满足此条件的关系称为规范化关系,否则称为非规范化关系。 例如,在表2.8中,籍贯含有省、市县两项,出现了“表中有表”的现象,则为非规范化关系,而把籍贯分成省、市县两列,将其规范化,如表2.
12、9所示。表2.8 表2.9,20,2.4.1 候选键与关系键 能唯一标识关系中元组的属性或属性集,则称该属性或属性集为候选键(Candidate Key),也称候选关键字或候选码。如: “学生关系”中的学号能唯一标识每一个学生,则属性学号是学生关系的候选键。 在“选课关系”中,只有属性的组合“学号+课程号”才能唯一地区分每一条选课记录,则属性集“学号+课程号”是选课关系的候选键。,2.4 关系的键,21,下面给出候选键的形式化定义: 设关系R有属性A1,A2,An,其属性集K=(Ai,Aj,Ak),当且仅当满足下列条件时,K被称为候选键:1. 唯一性(Uniqueness):关系R的任意两个不
13、同元组,其属性集K的值是不同的。2.最小性(Minimally):组成关系键的属性集(Ai,Aj,Ak)中,任一属性都不能从属性集K中删掉,否则将破坏唯一性的性质 例如:“学生关系”中的每个学生的学号是唯一的,“选课关系”中“学号+课程号” 的组合也是唯一的。对于属性集“学号+课程号” 去掉任一属性,都无法唯一标识选课记录。,22,如果一个关系中有多个候选键,可以从中选择一个作为查询、插入或删除元组的操作变量,被选用的候选键称为主关系键(Primary Key),或简称为主键、主码、关系键、关键字。 例如,假设在学生关系中没有重名的学生,则“学号”和“姓名”都可作为学生关系的候选键。如果选定“
14、学号”作为数据操作的依据,则“学号”为主关系键。 主关系键是关系模型中的一个重要概念。每个关系必需选择一个主关系键,选定以后,不能随意改变。每个关系必定有且仅有一个主关系键,因为关系的元组无重复,至少关系的所有属性的组合可作为主关系键,通常用较小的属性组合作为主关系键。,23,2.4.2 主属性与非码属性 主属性(Prime Attribute):包含在主码中的的各属性称为主属性。 非码属性(Non-Prime Attribute):不包含在任何候选码中的属性称为非码属性。 在最简单的情况下,一个候选码只包含一个属性,如学生关系中的“学号”,教师关系中的“教师号”。 在最极终端的情况下,所有属
15、性的组合是关系的候选码,这时称为全码(all-key)。,24,下面是一个全码的例子:假设有教师授课关系TCS,分别有三个属性教师(T)、课程(C)和学生(S)。一个教师可以讲授多门课程,一门课程可以为多个教师讲授,同样一个学生可以选听多门课程,一门课程可以为多个学生选听。 在这种情况下,T,C,S三者之间是多对多关系,(T,C,S)三个属性的组合是关系TCS的候选码,称为全码,T,C,S都是主属性。,25,2.4.3 外部关系键 如果关系R2的一个或一组属性X不是R2的主码,而是另一关系R1的主码,则该属性或属性组X称为关系R2的外部关系键或外码(Foreign key)。并称关系R2为参照
16、关系(referencing relation),关系R1为被参照关系(referenced relation)。 例2.1 假设在图1.12所示的教学数据库中增加一个系别关系D,包含两个属性系别(DEPT)和地址(ADDR),“系别”是此关系的主码,而“系别”并不是学生关系和教师关系的主码,所以“系别”是学生关系和教师关系的外部关系键。,26,例2.2 如图1.12所示的选课关系中的“学号”属性与学生关系的主码“学号”相对应,“课程号”属性与课程关系的主码“课程号”相对应,因此,“学号”和“课程号”属性是选课关系的外部关系键。学生关系和课程关系为被参照关系,选课关系为参照关系。由外部关系键的
17、定义可知,被参照关系的主码和参照关系的外码必须定义在同一个域上。 如选课关系中的“学号”与学生关系的主码“学号”定义在同一个域上,“课程号”属性与课程关系的主码“课程号”定义在同一个域上。,27,2.4.4 关系模型的完整性 为了维护数据库中数据与现实世界的一致性,对关系数据库的插入、删除和修改操作必须有一定的约束条件,这就是关系模型的三类完整性: 实体完整性 参照完整性 用户定义的完整性1. 实体完整性(Entity Integrity) 实体完整性是指主关系键的值不能为空或部分为空。 关系模型中的一个元组对应一个实体,一个关系则对应一个实体集。 例如,一条学生记录对应着一个学生,学生关系对
18、应着学生的集合。,28,现实世界中的实体是可区分的,即它们具有某种唯一性标识。与此相对应,关系模型中以主关系键来唯一标识元组。 例如,学生关系中的属性“学号”可以唯一标识一个元组,也可以唯一标识学生实体。 如果主关系键中的值为空或部分为空,即主属性为空,则不符合关系键的定义条件,不能唯一标识元组及与其相对应的实体。这就说明存在不可区分的实体,从而与现实世界中的实体是可以区分的事实相矛盾。因此主关系键的值不能为空或部分为空。 例如,学生关系中的主关系键“学号”不能为空;选课关系中的主关系键“学号+课程号”不能部分为空,即“学号”和“课程号”两个属性都不能为空。,29,2. 参照完整性(Refer
19、ential integrity) 如果关系R2的外部关系键X与关系R1的主关系键相符,则X的每个值或者等于R1中主关系键的某一个值,或者取空值。 在例2.1系别关系中的属性“系别”是学生关系外部关系键。 如图2.2所示,学生关系中某个学生(如s1或s2)“系别”的取值,必须在参照的系别关系中主关系键“系别”的值中能够找到,否则表示把该学生分配到一个不存在的部门中,显然不符合语义。 如果某个学生(如s11)“系别”取空值,则表示该学生尚未分配到任何一个系。否则,它只能取专业关系中某个元组的专业号值。,30,S(学生关系) D(系别关系)图2.2 学生表和系别表,31,在例2.2中,如果按照参照
20、完整性规则,选课关系中的外部关系键“学号”和“课程号”可以取空值或者取被参照关系中已经存在的值。但由于“学号”和“课程号”是选课关系中主属性,根据实体完整性规则,两个属性都不能为空。所以选课关系中的外部关系键“学号”和“课程号”中能取被参照关系中已经存在的值。 实体完整性和参照完整性是关系模型必须满足的完整性约束条件,被称作关系的两个不变性。任何关系数据库系统都应该支持这两类完整性。 除此之外,不同的关系数据库系统由于应用环境的不同,往往还需要一些特殊的约束条件,这就是用户定义完整性。,32,3. 用户定义完整性(User-defined Integrity) 用户定义完整性是针对某一具体关系
21、数据库的约束条件。 它反映某一具体应用所涉及的数据必须满足的语义要求。 例如,属性值根据实际需要,要具备一些约束条件,如选课关系中成绩不能为负数;某些数据的输入格式要有一些限制等关系模型应该提供定义和检验这类完整性的机制,以便用统一的、系统的方法处理它们,而不要由应用程序承担这一功能。,33,2.5.1 关系模式和关系数据库模式 一个关系的属性名的集合R(A1,A2,An)叫做关系模式。其中: R为关系名,A1,A2,An为属性名(i=1,2,n)。 由定义可以看出,关系模式是关系的框架,或者称为表框架,指出了关系由哪些属性构成,是对关系结构的描述。一组关系模式的集合叫做关系数据库模式。,2.
22、5 关系数据库模式与关系数据库,34,关系数据库模式是对关系数据库结构的描述,或者说是对关系数据库框架的描述,也就是前面所讲过的关系头,可以看作是关系的型。与关系数据库模式对应的数据库中的当前值就是关系数据库的内容,称为关系数据库的实例,即前面所讲过的关系体,可以看作是关系的值。 例如,在图1.12所示的教学数据库中,共有五个关系,其关系模式分别为: 学生(学号,姓名,性别,年龄,系别) 教师(教师号,姓名,性别,年龄,系别) 课程(课程号,课程名,课时) 选课(学号,课程号,成绩) 授课(教师号,课程号),35,在每个关系中,又有其相应的数据库的实例例如:与学生关系模式对应的数据库中的实例有
23、如下6个元组:,36,2.5.2 关系数据库 关系数据库是“一组随时间变化,具有各种度的规范化关系的集合”。 因为关系是由关系头和关系体组成的,所以关系数据库也可以看作是一组关系头和关系体的集合。 由此可见,关系数据库也有型和值的概念,其型就是关系数据库模式,相对固定;其值就是关系数据库内容,代表现实世界中的实体,而实体是随着时间不断变化的,所以其值在不同的时刻会有所变化。,37,例如:图1.12所示的教学数据库是五个关系的集合,或者说是五个关系头和五个关系体的集合。 其中,各个关系头相对固定,而关系体的内容,会随时间而变化。 比如,学生和教师的年龄随时间而增长,教师的工资和岗位津贴也会发生变
24、化。,38,关系模型与其他模型相比,最有特色的是它的数据库语言。 这种语言灵活方便、表达能力和功能都很强。 目前关系数据库所使用的语言一般都具有定义、查询、更新和控制一体化的特点,而查询是最主要的部分。 所以说,关系数据库的核心部分是查询,故又称为查询语言,而查询的条件要使用关系运算表达式来表示。 因此,关系运算是设计关系数据语言的基础。 按表达查询的方法不同,关系运算可分为关系代数和关系演算两大类。,2.6 关系代数,39,2.6.1 关系代数的分类及其运算符 关系代数是对关系进行集合代数运算,是基于关系代数的操作语言,称为关系代数语言,简称关系代数。 它是由IBM在一个实验性的系统上实现的
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
2000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 关系 模型 PPT
