空间数据库建立

空间数据库建立,第1张

在遥感图像处理系统空间数据库的建立过程中,由于我们的大部分资料来源于现有的地图,因而以地图的数据处理,采用扫描矢量化的数字化手段进行数据录入,各种地图处理,数据入库工作流程可分为预处理、图形扫描数字化、图层数据建立拓扑关系、建属性数据库、图层矢量数据与属性数据联接、投影转换、图幅拼接、图面整饰、数据入库九个阶段。如图7-9所示。

图7-9 数据采集工作流程图

(1)图形预处理

资源信息是多源和多尺度的。毫无疑问,对这些资料的初步整理是数字化工作进程的重要一环。

本系统将采用统一的坐标系统,坐标系为1980西安坐标系,高程系为1985国家高程基准。所有的图形数据均应该转换到此坐标系。

(2)图形扫描数字化

在地图数据采集过程中,由于地图原图质量、内容、比例尺和扫描过程中的种种因素,根据纸介质地图的图形要素和彩色特征提取的分层图仍会带有各种噪声以及不需要的其他一些信息,为了获得正确的、干净的数据,在数字化之前,要进行二值化、去脏、光滑、断线修补、细化处理等预处理步骤。

(3)图层数据建立拓扑关系与图形编辑

矢量化后的各图层,利用ArcGIS软件提供的功能建立拓扑关系,在建拓扑关系时会发现图形数据错误,要进行编辑、修改,再重新建立拓扑关系,这一过程可能做多次,直到数据正确为止。

(4)建属性数据库

按已采集的属性数据表,和标准规定格式,利用通用的数据库管理软件建立分层数据库,文字型数据要按标准代码录入。

(5)图层矢量数据与属性数据联接

按图元编码(用户ID)将矢量数据与属性数据联接。对于已建立联接的各类空间数据和属性数据,通过ArcGIS 系统对它们做进一步的编辑和修改,确保数据库的准确性和完整性。在ArcGIS 系统中,图形数据被分成“点”、“线”、“面”三种几何要素,它们都有各自相关的属性,在进行拓扑处理后,这三种要素间便拥有了相关的空间拓扑结构,这种空间数据关系与相应的属性数据是一种动态联结关系,这也是在ArcGIS系统中能够进行空间分析的关键所在。属性数据的编辑可通过ArcGIS系统的数据库管理系统进行数据结构定义(如数据项名称、类型、长度等)、数据编辑(如插入、删除、拷贝等)、数据查询检索等等,形成可供使用的属性数据库。

(6)投影转换

同一工作区可能利用不同比例、不同投影的图件,要对不同来源、不同时间分辨率和空间分辨率的点、线、面数据进行计算,在拼接图层之前必须对它们进行投影转换,使最终形成的图层均投影到一个坐标系统。

(7)图幅接边

图幅接边的目的是要保持图面数据连续性。工作区有多幅图构成,按上述步骤每幅图分层建立起图层之后,要对各相邻图幅分层进行拼接,图幅的接边精度要满足相应比例尺的国家精度要求。各图层中线图元或面图元拼接后其图元编号要进行改变,在右边图幅中的图元拼接后用左边图幅内的图元编号,下边图幅的图元改用上边图幅的图元编号。其属性数据也要合并为一个,属性数据结构不相同的图元(线或面)不能进行图幅拼接。对于一些图面标注的内容也要做相应的调整。到现在为止,已完成了图形库的建立工作。拼接完成后,仍按图幅分开储存与管理。

(8)数据入库

前面数据处理的目的都是为了使图形进入GIS数据库系统中,以作为其他应用系统的数据基础。图形数据将采用空间数据管理方式、利用系统软件将所有图形及属性统一存放于Oracle之中。

(9)图件输出与图面整饰

在每一图幅数字化完成后,或工作区各图幅分层拼接之后,要对图面标注内容逐一添加到图面上。按有关图例符号标准和用色标准对相应点、线、面图元的线型、符号、颜色进行设置定义。再就图名、图例、比例尺及其图面内容整饰后,输出图件成果。

(10)数据质量控制

检查内容包括数据完整性、逻辑一致性、位置精度、属性精度、接边精度、现势性等是否符合国家标准及有关技术规定。专题图形数据库建设质量控制的方案如下:

建立数据采集标准规范,详细阐述不同要素的采集要求,作为数据采集的根本基准,统一采集认识。

进行数据采集人员培训,熟练使用采集软硬件,掌握采集规范,采集过程中填写详细的图例簿,统一图例簿格式,记录每幅图数据生产过程的基本情况,特别是作业时遇到的问题及处理意见,质量情况等。

数据质量控制采用分级分层管理方式,首先,数据生产 *** 作人员在数据采集过程中严格遵守数据采集规范标准,采集后进行数据的第一次检查;其次,数据库集成人员进行第二次数据质量检查;最后,系统总工随机抽样检查。

检查方式多种多样,这里主要采用以下3种:屏幕视觉检查,打印出图检查,查错软件检查。

关系数据库:是建立在关系数据库模型基础上的数据库,借助于集合代数等概念和方法来处理数据库中的数据。

目前主流的关系数据库有oracle(甲骨文)、SQL、access、db2(IBM)、sqlserver,sybase等。

空间数据库:地理信息系统中的数据库,具有明显的空间特征,是某一区域关于一定地理空间要素的数据集合。

主要有:地形数据库、地名数据库、数字栅格地图数据库、数字正射影像数据库、数字高程模型(DEM、重力数据库、大地数据库。

地质图空间数据库的组成要素主要包括:对象类、要素类、关系类、综合要素类和要素数据集。组成地质图空间数据库要素数据集分为三大类:基本要素数据集、综合要素数据集和对象数据集。地质图要素数据集是共享空间参考系统的要素类的集合。在地质图数据模型中,由地质点、面、线要素实体类构成。一个要素数据集的空间参考指定了包括坐标系统、投影系统和高程系统的空间参照系、空间域和精度。具有拓扑关系,且具有相同几何类型和相同属性的要素的集合称为地质图要素类。构成地质图的点称为地质图点要素类,构成地质图的线称为地质图线要素类、构成地质图的面称为地质图面要素类。另外,一个地质图要素数据集还应包括属性域(domains),属性域是一个字段类型的合法值的规则,用于限制在表要素类,或子类型的任何具体的属性字段内允许的值。每个要素类或表有一个属性域的集合,这些属性域用于不同的属性和子类型,并且可以在地理数据库的要素类和表之间共享。

图5-2 地质图空间数据库实体关系

传统的地质图数据模型不能很好地解决上述问题,面向对象的技术和方法给我们带来了曙光。面向对象数据模型是以单个空间地质对象为数据组织和存储的基本单位,与拓扑关系数据模型相反,以独立完整、具有地质意义的对象为基本单位对地质空间进行表达,典型实例是ESRI公司的GeoDataBase模型。在具体组织和存储时,将对象的坐标数据和属性数据(如建立了部分拓扑,拓扑关系也放在表中保存)统一存放在关系数据库中。利用面向对象的思想对数字地质图数据进行重新组织与存储,使得数据的表达更接近于人们对客观世界的认识,其语义关系和内部关系更加合理,大大增强了高层次的地质空间分析能力。该模型使得数字地质图独立于任何给定的软件和硬件结构。

本文建库所采用的基本要素类包括:地质(线)界线、脉岩(点)、矿产地(点)、产状、火山口;综合要素数据集包括:蚀变带(面);对象数据集包括:沉积(火山)岩岩石地层单位、侵入岩岩石年代单位、变质岩地(岩)层单位、断层、面状水域与沼泽。

1数据库各要素类概念

采用以下要素对地质图空间数据库要素类、对象类和综合要素类描述与定义:

实体名称:实体数据的中文名称;

要素类名称:要素类的中文名称;

对象类名称:对象类的中文名称;

综合要素类名称:综合要素类的中文名称;

要素对象与综合要素类编码:数据项名称的标准化编码;

空间数据类型:指点线面类型;

数据类型:指数据存储的类型,一般包括字符型(C)、单精度数值(S)、双精度数值(D)、长整形(L)、整形等(I),对于特殊系统的数据类型,需要明确说明;

与其他实体的关系:表示该实体与其他实体的关系,如拓扑关系或依赖关系;

数据存储长度:存储于某一特定系统平台的字节数,为系统默认值;

数据显示长度:数据用于信息表达的长度,字符型数据说明字符个数,数值型数据说明小数点前后的位数,不确定长度的数据项需明确说明;

约束条件:确定数据项是否填写,按照以下三类规定,可选(O)、必选(M)、条件必选(C);若为必选(M)时,可填写是否为空(NOT NULL);

默认值/初始值:确定数据项在初始状态下的值;

值域范围:明确给出数据项的取值范围;

数据项描述:对需要进一步说明的数据项进行描述。对于特殊表达格式的数据项也需在此说明,如多数值表达的分隔符,特殊符号的表达描述等;

主关键字名称:用以标识记录的唯一性,并用于和其他实体进行关联的数据项的名称;

子关键字名称:和主关键字一起用以标识记录的唯一性,并用于和其他实体进行关联的数据项的名称;

索引键名称:用于按照一定规律排序的数据项的名称;

注释要素类编码:注释要素类数据项名称的标准化编码。

2组成地质图空间数据库要素数据集

包括三大类:基本要素数据集、综合要素数据集和对象数据集。地质图空间数据库包括要素、对象的分类,描述要素、对象的内容,要素、对象的关系等。

3基于地质数据库模型的地质图类图

图5-3是基于地质数据库模型的地质图类图,反映了地质图要素类与对象类之间的关系。

图5-3 地质数据库模型的地质图类图

4空间数据库各要素类字段定义

参照中国地质调查局地质调查技术标准 《数字地质图空间数据库》(DD2006-06)的建库标准,在ArcGIS 93 Catalog下,根据标准规定的各要素数据的数据格式建立各类要素集(Feature Classet)见表5-3,及数据表结构和填写规范,见表5-4至表5-11。

表5-3 基础数据库中各要素类一览表

表5-4 沉积(火山)岩图层表结构及填写规范

表5-5 侵入岩岩图层表结构及填写规范

表5-6 地质界线图层表结构及填写规范

表5-7 断层图层表结构及填写规范

续表

表5-8 蚀变图层表结构及填写规范

表5-9 火山机构图层表结构及填写规范

表5-10 矿点图层表结构及填写规范

续表

表5-11 岩墙图层表结构及填写规范

空间数据库是随着地理信息系统GIS的开发和应用发展起来的数据库新技术,主要用来处理空间数据。想必你了解数据库吧,那它主要用来处理数据,你也知道了吧,只不过空间数据库SDB主要用来处理空间数据,即二维、三维等特征数据,而不是传统的数值、字符串等。

空间矢量数据库是整个系统各种信息要素所依附的骨架,本次调查的矢量数据涉及地质背景、区域地球化学、遥感解译、农产品安全、非点源污染、特色农产品立地环境、社会经济、基础地理等,均要求以空间数据分层形式存储与管理。下面以地球化学数据子库建立为例简述矢量空间数据库建库工作流程(图4-4),其他矢量数据的建库过程基本类似于地球化学数据子库的建设。

(1)收集数据资料

资料收集主要是对入库数据的采集、分类,其内容包括野外采样记录、点位数据、测试分析数据、监控数据、统计单元划分图等。

(2)数据预处理

数据预处理就是在全面收集资料的基础上,对需入库的纸质图件进行扫描、校正、矢量化等处理,并检查采样点位、组合点位坐标数据的正确性,以保证其点位误差在允许范围之内。再对测试数据采用“速成等值线图”的方法分析研究、综合整理及筛选等,若不合理,则要反向检查测试分析数据的正确性。然后就可进行“扩边”处理,根据浙江省农业地质环境调查的实际情况,一般要求使用最外围的分析测试数据再往外填充8km。

图4-4 地球化学数据建库流程图

(3)数据网格化

数据网格化是对离散的、随机采样的分析数据点进行网格化处理,将不规则的离散数据点网格化为规则的数据点。网格化模型算法有最近点、距离倒数加权、三角剖分插值及克里金插值(包含多种漂移方式)等。数据网格化时要根据实际选择恰当的模型,比较常用的是最近点位和克里格插值模型。如在GeoMDIS 2002中,网格化时先选择欲 *** 作的数据对象,设置坐标字段和网格化的分析项元素并给定网格文件名称,然后选择网格化模型算法和相关参数,设置网格化的特征值后即可以进行数据网格化。

(4)定色阶

各种分析元素含量值差异性大,为使之有一个统一的尺度,使用01lg 含量间隔直接勾绘等值线,个别特殊元素单独处理。pH值等值线间隔按土壤酸碱度分级标准划分。为了便于追索等值线延伸情况,等值线被划分成若干个色区,划分时依据平均值和标准离差而定,生成相应元素的色阶文件(PAL),定色阶这一步骤是主要针对地球化学图的制作,其目的是达到色调显示的统一。

(5)生成等值线

在GeoMDIS 2000中,根据插值生成的网络数据文件,并设置上一步形成的色阶等参数,就可生成彩色等值线图件。

(6)数理统计

按行政区统计单元、不同土壤类型统计单元、不同地质背景统计单元进行相关地球化学参数统计,生成相应的专题图。

(7)图形编辑

对GeoMDIS 2000生成的等值线、极值点、注释等导入到编辑功能强大的编辑软件(如MapGIS)中根据需要进行编辑。处理等值线的“尖锐化”、“孤高点”等现象。要保证等值线自封闭、圆滑,然后对生成的等值线与水系图层(主要考虑较大范围水域边界线)一起重新造区,和第六步生成的统计专题图一起进行必要的图形整饰,最后形成合理的地球化学面色图件。

(8)分层与检查

按照浙江省农业地质环境信息系统属性数据格式、图层划分要求建立分层文件,并对建立的分层文件进行检查,主要检查是否丢失图元和内容,同时要对各图层进行拓扑错误检查,如果发现拓扑错误,则返回第七步进行修改。要确保数据质量合格才能转入下一步。

(9)属性采集

根据图面内容填写相应的属性采集表,做到属性表记录内容和图形上标注的编码一一对应。填好的属性采集表可在Excel、Dbase、Foxpro等软件录入,形成DBF格式的数据文件(蔡子华等,2002)。也可直接在GIS软件的属性管理库中完成,如利用参数赋属性或单独逐一赋值。输出属性数据表要进行系统检查、修改。

(10)属性挂接

先进行图元和属性的一致性检查。对原图和属性表及属性库进行一一对应检查,如果发现漏图元或属性紊乱则要进行返回到上一步重新处理。然后将属性数据文件和图形数据文件利用图元编号(ID号)或特殊标识意义的关键字段进行挂接,使空间图形和属性数据联系在一起。

(11)投影变换

根据《浙江省农业地质环境数据库图层及属性文件格式要求》对完成属性挂接的图层进行投影变换,转换至以度为单位的无投影地理坐标系。

(12)格式转换

因为AGEIS是矢量数据并以Arc/Info格式数据入库,所以MapGIS格式完成的数据,需转换成Arc/Info格式才能进行入库。转换成功的Arc/Info格式数据还需进行Clean拓扑重建 *** 作,在Arc/Info中使用Clean命令时需注意下列2个容限参数(樊红,1999)的选取:

第一个参数为Dangle Length(悬挂长度),用Clean命令使任何短于该长度的悬挂线段都被删掉,一般使用0000 001。

第二个参数为Fuzzy Tolerance(坐标距离),用Clean命令使间距小于坐标距离容差的2个或2个以上的坐标点就合并成一个,一般使用0000 001。MapGIS格式向Arc/Info格式转换后,对可能出现的错误需进行全面检查。

(13)数据入库

利用AGEIS系统提供的数据导入功能进行数据入库,形成地球化学数据子库。

一、目标任务

1主要工作任务

《1∶25万内陆干旱区地下水资源评价塔里木盆地地下水勘查空间数据库》是在综合研究已有资料的基础上,补充野外实际工作,建立了58个标准图幅的1∶25万空间数据库。

2技术要求

采用中国地质大学开发的MAPGIS软件平台,完全依照中国地质调查局提出的各项技术标准,执行中国地质调查局最新修订的《西北地下水资源勘查评价空间数据库工作指南》20版及其他相关标准。对选定的58幅1∶25万标准图幅综合水文地质图、地质图、生态环境水文地质图、地貌图、地下水开发利用规划图、地下水水化学类型图、地下水资源分布图、平原区地下水质量分区图、综合水文地质剖面图、重点流域等水位线图等图件进行数字化处理和空间数据库的建立。

参考标准或引用标准:

GB 2260中华人民共和国行政区划代码

GB 9649地质矿产术语分类代码

GB/14157水文地质术语

GB/T 14538-93综合水文地质图图例及色标(1∶200000~1∶500000)

GB/T 14848地下水质量标准

GB/T 13923-92,国土基础信息数据分类与代码(中国标准出版社,1992)

DZ/T 0197-1997数字化地质图图层及属性文件格式(国家行业标准)

西北地下水资源勘查评价空间数据库工作指南

3提交成果

1)数据库成果(光盘汇交):见表6-1。

2)文档:属性表、图幅基本概况表、工作日志、自检表、互检表、质检组检查表、图面检查表。

表6-1 成果汇交光盘物理存储结构

3)塔里木盆地地下水勘查包括58个标准图幅的水文地质专业图件共7张彩色喷墨全要素图各1张、重点流域等水位线图3张和综合水文地质剖面图1张。

4)《1∶25万内陆干旱区地下水资源评价塔里木盆地地下水勘查空间数据库》建库报告一份。

二、工作方法及流程

(一)项目组织与实施

项目由新疆地质调查院组织,由水文地质工程地质、绘图、计算机等专业技术骨干组成,严格按照规范和技术要求实施。

(二)工作方法

概据任务书的要求,收集、购买已出版的塔里木盆地58幅图的地理信息数字化成果数据,采用中国地质大学开发的MAPGIS61软件平台,将此数据在经纬秒格式下进行拼接,按《西北地下水资源勘查评价空间数据库工作指南》标准对地理属性进行了修改。各类专业图件经过专业人员的编图,经审查合格后,采用彩色或灰度扫描,进行图形数字化,做到图元丢失率为0,误差小于002mm,其精度均达到设计要求。数据在矢量化过程中以作者原图为主的原则,属性内容以报告和图面内容相结合的方法采集,成果资料中没有的不予反映。

(三)工作流程

本次数据库建设完全按照《西北地下水资源勘查评价空间数据库工作指南》的具体要求,对相关数据资料进行整理。在MAPGIS支持环境下完成图形数据的输入和编辑,利用Access系统下创建的满足《西北地下水资源勘查评价空间数据库工作指南》数据结构要求的数据表,完成外挂属性数据的录入,并实现图层与属性数据的连接。

1数据信息组成

根据新疆塔里木盆地地下水勘查总体设计书的要求,确定此次工作数据信息的内容为基础地理、基础地质、社会经济信息、水文地质信息(含水文地质条件、水文地质观测、地下水资源等)、环境地质信息、元数据信息,具体的数据信息与内容见表6-2。

表6-2 主要数据类型与数据特征

2图层划分

新疆塔里木盆地空间数据库的建设,从基础资料图件到成果表达图件,多数内容涉及大量的矢量图形。因此,标准化处理必须确定各种图件的图层划分、图元、属性等方面的内容,以使图形库最大限度地达到共享。图形分层主要考虑到便于图形的 *** 作、管理和计算,同时考虑数据本身的专业数据特点。图层划分详见表6-3 。

表6-3 塔里木盆地地下水勘查空间数据库图层划分

续表

注:#代表含水层编号,含水层未分时,#用“0”替代。

图6-1 工作流程示意图

3数据准备阶段

作者原图及简单图件用二值或灰度,以300dpi精度扫描,复杂图件用彩色以300DPI精度扫描。所有图件的图式图例参数说明文件放入README文件夹中。

4数据矢量化阶段

放大70倍进行图件的数字化处理。点线数字化时,要保证其准确性和自然光滑,有坐标的点采用单点展绘的方法直接投影到1∶25万图中,保证了精度。线数字化时,为确保拓扑时弧段不变形,未采用MAPGIS系统提供的线圆滑功能。

5检查矢量化图件

喷绘数字化图件,对照原图进行自检、互检、抽检,并由水文地质专家进行100%的检查,确保矢量化后的图形数据与原图件一致性和完整性。

6误差校正

塔里木盆地面积大,横跨4个带。各带图件经检查无误后,生成基于原图高斯北京投影带方式的理论图框,进行误差校正。每标准图幅采集13个控制点,除4个角点外,其余点均匀分布在图幅内。

7无投影格式下重新拓扑

将检查无误的数据投影到经纬度格式。在经纬度下再进行各带各类图件的拼接,为确保套合精度,重新进行拓扑,录入面属性,再将参与做面的线从整体拓扑图层中弧转线中分离出来,做线属性。

8喷绘图件

对参与整体拓扑的图层进行拓扑处理、错误检查、修改,然后编辑区颜色。将各图层形成工程文件后,彩喷出图。再由绘图专业人员和水文地质专家对照原图检查,检查出错误进行修改,再出图,再次检查,直至完全无误,最后彩喷成果图件。

9填写属性卡片

属性卡片的内容以原图和原报告为主要依据。

10录入属性

在MAPGIS属性库管理模块中将各图层ID号和图元编号做唯一。

11转换文件格式

将经纬度格式下的属性文件,生成E00文件,转入ARCINFO中,形成最终的ARCINFO格式数据。

工作流程见图6-1。

空间数据又称几何数据,它用来表示物体的位置、形态、大小分布等各方面的信息,是对现世界中存在的具有定位意义的事物和现象的定量描述。根据在计算机系统中对地图是对现实教想的存储组织、处理方法的不同,以及空间数据本身的几何特征,空间数据又可分为图形数据和图像数据。

空间数据包括以下五种类型:

1、地图数据:这类数据主要来源于各种类型的普通地图和专题地图,这些地图的内容非常丰富。

2、影像数据:这类数据主要来源于卫星、航空遥感,包括多平台、多层面、多种传感器、多时相、多光谱、多角度和多种分辨率的遥感影像数据,构成多元海量数据。

3、地形数据:这类数据来源于地形等高线图的数字化,已建立的数据高程模型(DEM)和其他实测的地形数据。

4、属性数据:这类数据主要来源于各类调查统计报告、实测数据、文献资料等。

5、混合数据:这类数据来源于卫星、航空遥感与各种类型的普通地图和专题地图形成多方面数据。

空间数据结构是空间数据适合于计算机存储、管理、处理的逻辑结构,是空间数据在计算机内的组织和编码形式,是地理实体的空间排列和相互关系的抽象描述。它是对空间数据的一种理解和解释。

空间数据结构又是指空间数据的编排方式和组织关系。空间数据编码是指空间数据结构的具体实现,是将图形数据、影像数据、统计数据等资料按一定的数据结构转换为适合计算机存储和处理的形式。不同数据源采用不同的数据结构处理,内容相差极大,计算机处理数据的效率很大程度取决于数据结构。

扩展资料:

空间数据库管理系统是空间数据库的核心软件,将对空间数据和属性数据进行统一管理,为GIS应用开发提供空间数据库管理系统除了必须具备普通数据库管理系统的功能外,还具有以下三方面研究内容:

1、空间数据存储管理,实现空间数据强大的基础平台。和属性数据的统一存储和管理,提高数据的存储性能和共享程度,设计实现空间数据的索引机制,为查询处理提供快速可靠的支撑环境。

2、支持空间查询的SQL语言,参照SQL-92和OpenGIS标准,对核心SQL进行扩充,使之支持标准的空间运算,具有最短路径、连通性等空间查询功能。

3、查询,供相关人士查询数据。

参考资料来源:百度百科-空间数据

以上就是关于空间数据库建立全部的内容,包括:空间数据库建立、常见的关系数据库和空间数据库、空间数据库结构定义等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/sjk/10073976.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-05-05
下一篇2023-05-05

发表评论

登录后才能评论

评论列表(0条)

    保存