
数据模型的组成要素
数据模型通常由数据结构、数据 *** 作和完整性约束条件三部分组成。
①数据结构
数据结构描述数据库的组成对象以及对象之间的联系。
②数据 *** 作
是指对数据库中各种对象(型)的实例(值)允许执行的 *** 作的集合,包括 *** 作及有关的 *** 作规则。
③数据的完整性约束条件
是一组完整性规则。数据模型应该反映和规定其必须遵守的基本和通用的完整性约束条件。
数据库技术的发展是沿着数据模型的主线推进的。
数据模型(data model)是对现实世界数据特征的抽象,也就是说数据模型是用来描述数据、组织数据和对数据进行 *** 作的。
数据模型是数据库系统的核心和基础。
数据模型应满足三方面要求:
①能比较真实地模拟现实世界
②容易为人所理解
③便于在计算机上实现
根据模型应用目的不同,可以分为两大类:
①概念模型 ②逻辑模型和物理模型
概念模型(conceptual model)
也称信息模型,按用户的观点来对数据和信息建模,主要用于数据库设计。
概念模型实际上是现实世界到机器世界的一个中间层次。
①信息世界中的基本概念
(1)实体(entity)
客观存在并可相互区别的事物称为实体。
(2)属性(attribute)
实体所具有的某一特征称为属性。
(3)码(key)
唯一标识实体的属性集称为码。
(4)实体型(entity type)
用实体名及其属性名集合来抽象和刻画同类实体,例如,学生(学号,姓名,性别,出生年月,所在院系,入学时间)就是一个实体型。
(5)实体集(entity set)
同一类型实体的集合称为实体集。
(6)联系(relationship)
包括实体内部的联系和实体之间的联系。
实体之间的联系通常是指不同实体集之间的联系。
实体之间的联系有一对一、一对多和多对多等多种类型。
②概念模型的一种表示方法:实体-联系方法
该方法用E-R图来描述现实世界的概念模型,E-R方法也称为E-R模型。
关系模型的三个组成部分,是指关系数据模型的数据结构、关系数据模型的 *** 作集合和关系数据模型的完整性约束。
数据结构用于描述系统的静态特性,是所研究的对象类型的集合。这些对象是数据库的组成部分,它包括用于表示数据类型、内容、性质的对象,以及表示数据之间联系的对象。数据 *** 作用于描述系统的动态特性,是指对数据库中各种对象及实例允许执行的 *** 作集合及 *** 作规则。
数据库的 *** 作主要包括检索与更新两种,其中更新 *** 作包含插入、删除和修改。数据的完整性约束则是为了保证数据的正确性、有效性和相容性,预先规定的一些规则条件,用以限定符合数据模型的数据库状态以及状态的变化。
数据模型(Data Model)是数据特征的抽象,它从抽象层次上描述了系统的静态特征、动态行为和约束条件,为数据库系统的信息表示与 *** 作提供一个抽象的框架。数据模型所描述的内容有三部分,分别是数据结构、数据 *** 作和数据约束。
模型可更形象、直观地揭示事物的本质特征,使人们对事物有一个更加全面、深入的认识,从而可以帮助人们更好地解决问题。利用模型对事物进行描述是人们在认识和改造世界过程中广泛采用的一种方法。
计算机不能直接处理现实世界中的客观事物,而数据库系统正是使用计算机技术对客观事物进行管理,因此就需要对客观事物进行抽象、模拟,以建立适合于数据库系统进行管理的数据模型。数据模型是对现实世界数据特征的模拟和抽象。
数据模型是数据库设计中用来对现实世界进行抽象的工具,是数据库中用于提供信息表示和 *** 作手段的形式构架。数据模型是数据库系统的核心和基础。
模型是对现实世界的抽象。在数据库技术中,表示实体类型及实体类型间联系的模型称为“数据模型”。
数据模型是数据库管理的教学形式框架,是用来描述一组数据的概念和定义,包括三个方面:
1、概念数据模型(Conceptual Data Model):这是面向数据库用户的实现世界的数据模型,主要用来描述世界的概念化结构,它使数据库的设计人员在设计的初始阶段,摆脱计算机系统及DBMS的具体技术问题,集中精力分析数据以及数据之间的联系等,与具体的DBMS无关。概念数据模型必须换成逻辑数据模型,才能在DBMS中实现。
2、逻辑数据模型(Logixal Data Model):这是用户从数据库所看到的数据模型,是具体的DBMS所支持的数据模型,如网状数据模型、层次数据模型等等。此模型既要面向拥护,又要面向系统。
3、物理数据模型(Physical Data Model):这是描述数据在储存介质上的组织结构的数据模型,它不但与具体的DBMS有关,而且还与 *** 作系统和硬件有关。每一种逻辑数据模型在实现时都有起对应的物理数据模型。DBMS为了保证其独立性与可移植性,大部分物理数据模型的实现工作又系统自动完成,而设计者只设计索引、聚集等特殊结构。
数据模型的三要素:
一般而言,数据模型是严格定义的一组概念的集合,这些概念精确地描述了系统的静态特征(数据结构)、动态特征(数据 *** 作)和完整性约束条件,这就是数据模型的三要素。
1。 数据结构
数据结构是所研究的对象类型的集合。这些对象是数据库的组成成分,数据结构指对象和对象间联系的表达和实现,是对系统静态特征的描述,包括两个方面:
(1)数据本身:类型、内容、性质。例如关系模型中的域、属性、关系等。
(2)数据之间的联系:数据之间是如何相互关联的,例如关系模型中的主码、外码联系等。
2 。数据 *** 作
对数据库中对象的实例允许执行的 *** 作集合,主要指检索和更新(插入、删除、修改)两类 *** 作。数据模型必须定义这些 *** 作的确切含义、 *** 作符号、 *** 作规则(如优先级)以及实现 *** 作的语言。数据 *** 作是对系统动态特性的描述。
3 。数据完整性约束
数据完整性约束是一组完整性规则的集合,规定数据库状态及状态变化所应满足的条件,以保证数据的正确性、有效性和相容性。
数据库是信息系统的基础和核心,把大量的数据信息按一定的模型组织起来存储在数据库中,提供数据维护、数据检索等功能,使信息系统能方便、及时、准确地从数据库中获得所需的信息。因此,数据库结构设计是信息系统开发的重中之重。
经分析航空物探数据具有空间性、海量性、多源性和多尺度的特点,这说明航空物探数据具有典型的空间数据的特点,可以采用空间数据管理方式进行管理。
ESRI公司的Geodatabase(空间数据库)是采用标准关系数据库技术来表现地理信息的面向对象的高级GIS数据模型,是建立在DBMS之上的统一的、智能化的空间数据模型,是以一组相关联的表来表达地理要素之间关系、有效性规则和值域。对于多源、海量的航空物探数据,Geodatabase能在一个统一的模型框架下很好地解决多源数据一体化存储的问题,和采用标准关系数据库技术来表现海量航空物探数据的地理信息特性。Geodatabase引入了地理空间实体的行为、有效性规则和关系,在处理Geodatabase中对象时,对象的基本行为和必须满足的规则无需通过程序编码实现,只需根据需要扩展其有效性规则(Geodatabase面向对象的智能化特性),即可支持航空物探数据模型扩展的需要。
因此,航空物探数据库是空间数据库,在航空物探数据库建模过程中,以空间数据建模为主导,统领属性数据建模。
二、统一空间坐标框架
为了用数学语言描述地球,人们用规则的几何形体来替代地球表面,从地球自然表面、大地水准面、旋转椭球面直到用简单数学函数表达的参考椭球体,以便通过地图投影将三维曲面转化成二维平面。由于地球表面不同地区的地形起伏差异很大,采用单一椭球体势必会造成某地区的误差小而其他地区误差很大的结果。因此,在20世纪初不同国家或地区先后采用了逼近本国或本地区地球表面的椭球体,如中国的克拉索夫斯基椭球体,美国的海福特椭球体、英国的克拉克椭球体等。这又造成了目前世界各国的地理信息空间坐标框架不统一,空间数据信息难以共享被动局面。为此,在实现数字地球计划中,必须规范和统一世界上不同国家和地区的地球参考椭球体。
在小区域表达地球表面时,通常采用平面的方式,即投影坐标系统。如何科学地选择投影坐标,一般要根据具体的地学应用、地理区域和范围、比例尺条件等因素来确定,不同的国家有着不同的规定。
通过对航空物探数据的坐标系统进行分析可知,航空物探图件的坐标框架与国家对基本比例尺制图的规定相一致,即小比例尺编图采用Lambert双标准纬线等角圆锥投影;中比例尺采用Gauss 6°带的分带投影;大比例尺采用Gauss 3°带的分带投影(表2-1);对于低纬度的海上作业区通常采用Mecator等角圆柱投影。地球椭球体分别采用1954北京坐标系的Krassovsky椭球参数、WGS84椭球参数和未来的国家2000坐标系的椭球参数。
表2-1 航空物探地理坐标数据的投影方式
传统的航空物探数据是按测区管理的,根据测区的测量比例尺来确定相应的坐标框架;因此,勘探目标不同的测区测量比例尺是不一致的,地坐标框架也不同。航空物探数据库要将不同测区、不同比例尺、不同坐标框架的数据集中管理和可视表达,若没有统一的空间坐标框架,就不可能正确地表达全国航空物探数据。所以,面对如此复杂的多坐标框架的航空物探数据,如何确定科学合理的空间坐标框架,将全国的航空物探数据整合到统一的空间参考框架下,实现数据的统一存储和数据间无缝拼接,是航空物探数据库建设的关键所在,是组织和管理多维、多格式、大跨度、跨平台的航空物探数据和多目标数字制图的数学基础。
统一的空间坐标框架必须支持我国领土覆盖的海域和陆域航空物探数据的存储和表达。我国领土东西跨度达70°,南北达55°,显然采用任何投影坐标系都是不合适的。Gauss 6°投影适合6°带内空间数据表达,若全国航物探数据采用6°分带表达,在高纬度地区会造成6°带间数据裂缝问题;Lambert投影可满足数据的无缝表达,但对大比例尺数据变形较大,无法满足数据制图的精度要求;Mecator投影也可满足数据的无缝表达,低纬度地区也能满足大比例尺数据制图的精度要求,但在我国中高纬度区存在着严重变形问题。所以,航空物探数据模型采用地理坐标(无投影,图2-1)格式存放,可根据实际应用的需要将航空物探数据变换到任何方式的投影坐标系统。
航空物探数据库模型采用Beijing_1954地理坐标系,相关参数如下:
角度单位:°(0017453292519943299rad)
零经线:格林尼治(0000000000000000000)
基准:D_Beijing_1954
椭球:Krasovsky_1940
长轴半径:6378245000 m
短轴半径:6356863019 m
建立统一坐标框架是空间数据库建设的一项基础性工作,采用Beijing_1954 地理坐标系作为航空物探数据库统一空间坐标框架具有以下优点。
图2-1 统一空间坐标框架示意图
(一)无缝空间数据存储
统一空间坐标框架解决了复杂的航空物探数据的坐标系统、投影、比例尺等不统一的问题,实现同一性质的物探数据在同一个主题中进行管理。如全国的航磁异常数据可放在一个图层上进行管理。
(二)适合多尺度表达
按测区管理的多尺度、多框架的航空物探数据是处于一个相对坐标系统中,各个测区间相对位置关系会发生错位。采用统一的Beijing_1954地理坐标框架,恢复了各测区间正确的位置关系,实现不同尺度数据的集成和正确表达,易于多源异构空间数据的融合。
(三)大区域数据集成
我国海陆面积近1300×104km2,地域跨度较大。在进行小比例尺的航空物探编图时,需要选用与之相适应的投影坐标;在陆地和海域进行大比例尺制图时,同样需要选用合适投影系统。航空物探制图的实践也证明了这一点。1995 年6 月由中国、加拿大、美国、爱尔兰和俄罗斯等国科学家共同编制的1∶1000万欧亚东北地区磁异常与大地构造图,采用横轴Mercator投影。中心编制的1∶500 万全国航磁图采用Lambert投影。2008 年,由中国和吉尔吉斯斯坦科学家编制的1∶100万中吉天山金属矿产成矿规律图,采用Lambert投影,将两个国家不同时期、不同尺度的数据进行了有效的集成,是地质、地球物理等综合应用的典范。
随着航空物探数据应用领域的不断扩展,陆地、海域,甚至于洲际和全球航空物探数据的整体表达都需对坐标投影提出要求。采用统一的地理坐标框架的航空物探数据非常容易变换到指定的投影坐标框架,满足多样化的制图要求。
三、要素类和对象类的划分
Geodatabase空间数据库模型结构(图2-2)分为空间数据库、要素数据集(Feature dataset)、要素类(Feature classes)、要素(Feature)4个层次。为了建立航空物探Geodatabase空间数据模型,我们依据Geodatabase模型关于要素类和对象类的划分原则,结合相关的国家标准和地球物理行业标准,制定了《航空物探数据要素类和对象类划分标准》,对航空物探数据进行数据分类。
图2-2 空间数据库模型结构
1)按照航空物探数据的空间特征,将其划分为5个要素数据集,即勘查项目概况要素数据集、基础数据要素数据集、异常要素数据集、解释要素数据集和评价要素数据集。
2)根据航空物探测量方法、数据处理过程以及推断解释方法和过程,进一步把航空物探数据划分为若干要素类和对象类,定义了要素类的主题特征和表达方式,确定子类和属性域;定义对象类的结构和联接字段,建立了关系类。
3)定义要素类的内容、字段名称和存储结构。在航空物探数据采集过程中,不同类型的数据采样率不同,坐标数据采样2次/s,重力场数据采样2次/s,磁场数据采样10次/s,这就造成了场值数据与坐标数据无法一一对应问题。若按场值数据采样率内插坐标数据,将导致数据量成倍增长;若按坐标数据采样率抽稀场值数据,将降低航空物探测量对地质体的分辨能力,影响测量效果。在综合分析航空物探数据应用基础上,提出了采用要素数据与属性数据分置的方式,将测线坐标数据与地球物理场数据分离,分别建立独立共享的航迹线数据要素类模型,磁场、重力场等数据对象类模型(图2-3),很好地解决了航空物探数据的存储问题。
图2-3 要素数据与属性数据分置示意图
采用要素数据与属性数据分置方式,不仅是基于航空物探数据属性数据的多源性、不同采样频率等特点的考虑,还考虑到数据的综合查询和检索的速度,特别是通过ArcSDE访问空间数据库的效率的问题。再者,对于大部分用户来说,需求是属性数据的综合应用,因此在数据库建模过程中,将属性数据采用对象类的方式进行管理,不但提高了空间数据的 *** 作能力,同时在ArcSDE的配置上采用直接访问数据库(对象类)方式,并且加快了数据查询和统计的速度。
四、数据库概念模型
用户需求是数据库建设的约束条件之一。航空物探数据的空间特性决定航空物探数据库必须是空间数据库,采用数据库管理数据,利用GIS技术提供可视化服务,这是各个层次用户的一致要求。因此,我们从现实世界出发,对航空物探数据的多源性、多尺度和不同采样等问题进行了描述,提出了解决方案。此方案是不依赖于任何具体的硬件环境和数据库管理系统(DBMS),建立了客观反映现实世界的航空物探数据库概念模型,把用户需要管理的信息统一到整体概念结构中,表达了用户需要。
在全面分析航空物探业务流程和数据流程,以及航空物探数据特性的基础上,按照《航空物探数据要素类和对象类划分标准》,以及空间实体点、线、面要素特征的基本原则,对航空物探数据库所涉及的实体进行归类,划分成12个主题。根据空间数据分主题表达的特点和航空物探空间数据坐标框架的定义,确定航空物探数据库空间数据概念模型,明确各个主题的用途、数据来源、表达方式、空间参考、比例尺和精度等内容,按照ArcGIS定义空间数据库的数据分层表达方式(图2-4),完成航空物探数据库概念模型设计(图2-5)。
图2-4 航空物探数据库空间数据分层模型
图2-5 航空物探数据库空间数据概念模型
以上就是关于数据模型的组成要素包括全部的内容,包括:数据模型的组成要素包括、数据模型的三个组成部分、试述数据模型的概念,数据模型的作用和数据模型的三个要素等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)