
数据库因不同的应用要求会有各种各样的组织形式。数据库的设计就是根据不同的应用目的和用户要求,在一个给定的应用环境中,确定最优的数据模型、处理模式、存贮结构、存取方法,建立能反映现实世界的地理实体间信息之间的联系,满足用户要求,又能被一定的DBMS接受,同时能实现系统目标并有效地存取、管理数据的数据库。简言之,数据库设计就是把现实世界中一定范围内存在着的应用数据抽象成一个数据库的具体结构的过程。
空间数据库的设计是指在现在数据库管理系统的基础上建立空间数据库的整个过程。主要包括需求分析、结构设计、和数据层设计三部分。
1、需求分析
需求分析是整个空间数据库设计与建立的基础,主要进行以下工作:
1)调查用户需求:
了解用户特点和要求,取得设计者与用户对需求的一致看法。
2)需求数据的收集和分析:
包括信息需求(信息内容、特征、需要存储的数据)、信息加工处理要求(如响应时间)、完整性与安全性要求等。
3)编制用户需求说明书:
包括需求分析的目标、任务、具体需求说明、系统功能与性能、运行环境等,是需求分析的最终成果。
需求分析是一项技术性很强的工作,应该由有经验的专业技术人员完成,同时用户的积极参与也是十分重要的。
在需求分析阶段完成数据源的选择和对各种数据集的评价
2、结构设计
指空间数据结构设计,结果是得到一个合理的空间数据模型,是空间数据库设计的关键。空间数据模型越能反映现实世界,在此基础上生成的应用系统就越能较好地满足用户对数据处理的要求。
空间数据库设计的实质是将地理空间实体以一定的组织形式在数据库系统中加以表达的过程,也就是地理信息系统中空间实体的模型化问题。
1)概念设计
概念设计是通过对错综复杂的现实世界的认识与抽象,最终形成空间数据库系统及其应用系统所需的模型。
具体是对需求分析阶段所收集的信息和数据进行分析、整理,确定地理实体、属性及它们之间的联系,将各用户的局部视图合并成一个总的全局视图,形成独立于计算机的反映用户观点的概念模式。概念模式与具体的DBMS无关,结构稳定,能较好地反映用户的信息需求。
表示概念模型最有力的工具是E-R模型,即实体-联系模型,包括实体、联系和属性三个基本成分。用它来描述现实地理世界,不必考虑信息的存储结构、存取路径及存取效率等与计算机有关的问题,比一般的数据模型更接近于现实地理世界,具有直观、自然、语义较丰富等特点,在地理数据库设计中得到了广泛应用。
2)逻辑设计
在概念设计的基础上,按照不同的转换规则将概念模型转换为具体DBMS支持的数据模型的过程,即导出具体DBMS可处理的地理数据库的逻辑结构(或外模式),包括确定数据项、记录及记录间的联系、安全性、完整性和一致性约束等。导出的逻辑结构是否与概念模式一致,能否满足用户要求,还要对其功能和性能进行评价,并予以优化。
从E—R模型向关系模型转换的主要过程为:
①确定各实体的主关键字;
②确定并写出实体内部属性之间的数据关系表达式,即某一数据项决定另外的数据项;
③把经过消冗处理的数据关系表达式中的实体作为相应的主关键字
④根据②、③形成新的关系。
⑤完成转换后,进行分析、评价和优化。
3)物理设计
物理设计是指有效地将空间数据库的逻辑结构在物理存储器上实现,确定数据在介质上的物理存储结构,其结果是导出地理数据库的存储模式(内模式)。主要内容包括确定记录存储格式,选择文件存储结构,决定存取路径,分配存储空间。
物理设计的好坏将对地理数据库的性能影响很大,一个好的物理存储结构必须满足两个条件:一是地理数据占有较小的存储空间;二是对数据库的 *** 作具有尽可能高的处理速度。在完成物理设计后,要进行性能分析和测试。
数据的物理表示分两类:数值数据和字符数据。数值数据可用十进制或二进制形式表示。通常二进制形式所占用的存贮空间较少。字符数据可以用字符串的方式表示,有时也可利用代码值的存贮代替字符串的存储。为了节约存贮空间,常常采用数据压缩技术。
物理设计在很大程度上与选用的数据库管理系统有关。设计中应根据需要,选用系统所提供的功能。
4)数据层设计
大多数GIS都将数据按逻辑类型分成不同的数据层进行组织。数据层是GIS中的一个重要概念。GIS的数据可以按照空间数据的逻辑关系或专业属性分为各种逻辑数据层或专业数据层,原理上类似于图片的叠置。例如,地形图数据可分为地貌、水系、道路、植被、控制点、居民地等诸层分别存贮。将各层叠加起来就合成了地形图的数据。在进行空间分析、数据处理、图形显示时,往往只需要若干相应图层的数据。
数据层的设计一般是按照数据的专业内容和类型进行的。数据的专业内容的类型通常是数据分层的主要依据,同时也要考虑数据之间的关系。如需考虑两类物体共享边界(道路与行政边界重合、河流与地块边界的重合)等,这些数据间的关系在数据分层设计时应体现出来。
不同类型的数据由于其应用功能相同,在分析和应用时往往会同时用到,因此在设计时应反映出这样的需求,即可将这些数据作为一层。例如,多边形的湖泊、水库,线状的河流、沟渠,点状的井、泉等,在GIS的运用中往往同时用到,因此,可作为一个数据层。
5)数据字典设计
数据字典用于描述数据库的整体结构、数据内容和定义等。 数据字典的内容包括: 1)数据库的总体组织结构、 数据库总体设计的框架 。 2)各数据层详细内容的定义及结构、 数据命名的定义 。 3)元数据(有关数据的数据,是对一个数据集的内容、质量条件及 *** 作过程等的描述) 。
(一)问题的提出
塔里木河流域生态环境动态监测系统的运转需要大量的空间数据支持。在空间数据库构建前期,采集了塔里木河流域的各尺度基础地形图、生态环境专题图以及遥感影像资料等图形、图像数据,这些数据都是以分幅的成果进行收集和提交的,需要进入综合数据库中,以实现数据的共享。
我国国土版图大,而且大部分位于中、低纬度地区,因此我国现行的大于1∶50万比例尺的各种地形图都采用高斯-克里格投影即横切椭圆柱正形投影。经过高斯-克里格投影后的平面直角坐标系是以相切的经线(中央经线)的投影为X轴,以赤道的投影为Y轴。高斯-克里格投影具有以下特点:
(1)中央经线投影为直线,而且是投影的对称轴(也是投影平面的X轴)
(2)高斯-克里格投影是等角投影,投影后具有角度不变、伸长固定的特点(即同一地点各个方向的长度比不变),满足等角的要求
(3)中央经线上长度没有变形,离中央经线越远变形越大。为了限制投影变形,必须进行分带投影。所谓分带就是按照一定的经度差,将椭球体按经线划分成若干个狭窄的区域,各个区域分别按高斯投影的规律进行投影,每一个区域就称为一个投影带。在每一个投影带内,位于各带中央的子午线就是轴子午线,各带相邻的子午线叫边缘子午线。分带之后,各带均有自己的坐标轴和原点,形成各自独立但又相同的坐标系统。根据国际通用方法,我国投影分带主要有两种:在我国1∶2.5万到1∶50万地形图均采用6°分带投影,1∶1万及更大比例尺的地形图采用3°分带投影,以保证投影变形误差满足地图的精度要求(王密等,2001)。
本系统所采集到的数据产品的空间参考大都是以高斯投影后的平面坐标为基础的分幅数据。塔里木河流域地域广阔,地理坐标介于东经73°10'~94°05',北纬34°55'~43°08'之间,以1∶10万基础地形图数据为例,按照高斯投影后的坐标分成了13°、14°、15°、16°四个6°高斯投影带,每个带的坐标都是以本带的坐标原点为参考点,空间基准不统一,如果将这些数据直接进行入库,将在跨带处产生缝隙,不能形成逻辑意义上完整的河流表现,也无法完成基于整个流域的生态环境分析,因此,必须采用相应的数据处理与建库技术,实现塔河整个流域数据的无缝集成管理,使之形成统一的整体。从基础数据的获取开始,进行精心设计和组织,分离出数据物理层和数据逻辑层,在统一的空间框架之下,将物理层归化到逻辑层,以消除逻辑层的缝隙,从而实现用户级的逻辑无缝空间数据库。
(二)无缝数据库
随着GIS数据发布与共享技术的发展,无缝空间数据库逐渐分化出两个层次的含义:一是GIS系统内部的数据无缝,一是不同GIS实现互 *** 作时的数据无缝。前者是通常意义的无缝,后者主要通过数据标准化与 *** 作标准化来实现。无缝空间数据库的最终含义体现在逻辑无缝数据库。无论是多源还是单源、同构还是异构,跨越数据层呈现在用户面前的GIS空间数据库必须是逻辑无缝的。
空间数据的无缝连接是一个建立在用户与数据库接口基础上的概念,意味着GIS管理的数据不再是单一、被硬性割裂的图幅,而是范围更加广阔的区域,这个区域小可到一个城市,大可到一个国家甚至整个地球(王卉、王家耀,2004)。由于硬软件条件的限制,计算机系统尚不能同时处理海量的空间数据,因此从具体技术的实施上,可采用将空间数据分块存储于数据库中,数据库提供相应的图块拼接信息。物理上空间数据是有缝隙的,但空间数据库提供图块之间的接图信息及相应的拼接访问手段,保障了空间数据在使用上的空间连贯性,即数据在逻辑使用上是无缝的(王密等,2001)。
(三)缝隙产生原因
在现实世界中,地理空间是由地貌、地物组成的连续的表层空间,地理信息则是有关地理空间的一切有用的知识。在计算机世界中,地理信息通过抽象、建模形成数字化的表示形式,通过空间数据库来进行表达、存储和管理(朱欣焰等,2002)。空间地理数据缝隙是在数据的获取、表示与处理过程中产生的数据不连续现象。
1.数据源
由于历史和现实的原因,地图是绝大多数GIS系统直接的数据源。地图是地球三维椭球面的二维平面表达,本身对真实世界有扭曲地图是对连续空间的割裂表达,实体被分割到不同的地图空间中去高斯投影是基本比例尺地形图经常选用的投影,也是绝大多数GIS系统的数学基础,由于分带的原因,使得投影后带有高斯投影平面坐标的地图无法实现无缝拼接。
2.数据表达与组织方式
空间地理几何数据的表示主要有栅格和矢量两种不同的形式。栅格形式是将地理表层空间划分为一系列网格,空间目标由这些网格的位置及其量化值来表示,这些网格本身就是连续空间信息的离散表达。矢量形式则是将地理空间的一切事物、概念进行抽象,形成点、线、面,由点、线、面来组成各类空间目标。按点、线、面来分类和按分层的思想来组织空间数据,也割裂了实体之间内在的联系。
在空间数据库组织与管理上,目前主要有文件型、文件与关系数据库混合型、全关系型以及对象关系型。传统的文件型空间数据库、文件与关系混合型空间数据库,按图幅或一定的区域范围以文件的形式来组织与存储空间几何数据,不同的图幅或区域之间存在缝隙。在文件与关系数据库混合型的空间数据库中,空间几何数据贮存在文件中,属性数据贮存在关系数据库中,属性数据和几何数据之间通过内部标识来链接,空间几何数据和属性数据之间存在缝隙。
3.数据处理
数据处理的过程中也会引入缝隙,产生这种缝隙的原因有:①数据处理过程的顺序不一致②选择的处理参数不一致③数字化的精度不一致。
4.多源异构数据共享
数据属性(数学基础、比例尺、用途、时间、精度等)的不同,导致了数据的差异,这些差异是多层次和多方面的,它们集中体现了数据的异构。数据异构和多源往往是一体的,多源异构是系统内部和系统之间数据裂隙的主要原因(刘仁峰,2005)。
(四)数据缝隙类别和表现
数据缝隙基本可以分为物理缝隙和逻辑缝隙两类。物理缝隙是地理空间的分离存储,本来连续的实体空间被分离到不同的存储空间和存储单元中去,例如空间数据的分幅、分层存储。逻辑缝隙是指逻辑上本身连续的信息不能以逻辑连续的方式呈现,例如跨越多幅图的一条河流,在图幅内查询河流属性(如长度)时只能获取其在本图幅内的相关信息而不是实体整体的信息。显然,由于空间信息本身的海量特性,要完全意义上的实现物理无缝的空间数据库目前还是不可能的,也没有必要。GIS用户关心的不是空间数据是物理无缝,因为GIS呈现给用户的是数据逻辑层,只需要保证用户看到的数据是逻辑无缝的。
物理有缝的数据库向逻辑无缝数据库的转换是无缝空间数据库构建的重要一环。
(五)无缝镶嵌技术
数据的无缝连接包含以下几个问题:投影、坐标系统、比例尺、数据精度等。对不同投影和坐标系统的空间数据在投影和坐标系统上统一采用相同的标准,当空间数据具有多尺度时,无缝连接寻找数据集之间连续的表达方式,它表现为不同尺度数据之间的集成。建立无缝空间数据的关键在于在合适的空间信息框架上实现多源异构空间数据的融合,框架是基础,融合是手段。
1.合适的空间框架选择
(1)适合多尺度信息表达。地球是一个开放的非常复杂的巨大系统,随着观察视角的变化,我们希望空间地理信息比例尺也自动增减。由于地图的自动综合受诸多因素的影响,目前比较可行的是采用多尺度空间数据支持来达到目的。所谓多尺度就是指系统内包含几种不同比例尺(或分辨率)的空间数据,其目的是为了适度地反映系统所关心区域的空间地理信息,以避免地物信息的过粗、失真或地物信息的负载量过大而无法使用。无缝空间数据库也应该符合多尺度空间数据库要求。
(2)适合大区域表达。各种自然和人文现象的空间分布,有其内在的原因和规律,这些原因和规律的获得,往往需要研究大区域多因素的综合作用另一方面,对于全球范围的环境变异和气候变迁的研究需要基于数字地球的空间框架。大区域的表达,还涉及空间尺度问题,不应继续采用欧氏空间尺度,而应该采用大地线尺度空间。
2.多源异构空间数据的融合
(1)GIS的迅速发展和广泛应用导致了多源空间数据的产生。如何实现不同的GIS软件共享并 *** 作不同来源的地理数据,即GIS多源空间数据的集成,成为GIS发展的关键。目前GIS多源空间数据的集成主要朝着三个方向发展,一是通过建立统一的数据交换标准来约束并规范已有的各类地理信息系统,采用数据交换标准来进行空间数据交换二是建立开放式地理数据互 *** 作规范,进行地理信息系统互 *** 作三是GIS数据中间件技术。
(2)统一数据交换标准存在很多实现上的困难。互 *** 作是一个重要发展趋势,是在异构分布式数据库中实现信息共享的途径,它需要将GIS技术、分布处理技术、面向对象方法、数据库设计及实时信息获取方法更有效地结合起来。所谓GIS数据中间件技术是指能够嵌入各类GIS系统的软件,GIS开发者通过中间件开发商提供的接口,访问和 *** 作特定的数据源。
(3)在多源异构数据集成技术尚未成熟的时候,人们再次把目光投向数据本身,如果可以提供关于数据的详细描述,是否可以提高融合数据的能力呢?于是,对于“关于数据的数据”的研究,即对于元数据的研究便普遍展开。从DublinCore到CSDGM与OGC,都提出了相应的元数据标准体系,有了完整而完善的元数据描述,必将提高数据的效能,从而最终促进多源异构数据库向无缝空间数据库的归化。
为实现塔河整个流域数据的无缝集成管理,使之形成统一的整体,设计从缝隙产生的地方开始,分离出数据物理层和数据逻辑层,在统一的空间框架之下,将物理层归化到逻辑层,以消除逻辑层的缝隙,从而实现用户级的逻辑无缝空间数据库同时制定统一的数据提交规范,如所有矢量数据在入库前统一采用经纬度坐标,栅格数据统一提供两套数据,即高斯坐标和经纬度坐标,以满足不同用户的管理需求和精度要求。
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)