
徐殿桂
(中国石油化工股份有限公司西南油气分公司信息中心档案馆)
摘要 本文通过对分布式管理技术的研究,分析了分布式管理系统的特点,结合油气田地质资料的管理模式,提出了分布式管理平台建设方案,形成了油气田分公司级地质资料分布式管理网络,并在生产科研中取得了良好应用效果。
关键词 分布式管理模式 地质资料管理系统 地质档案应用 系统架构
0 引言
由于西南油气田矿业权涉及四省一市,点多面广,为了更好地让地质档案服务于科研生产,在地质档案管理上采用了区域集中、统一管理的模式。近年来,又先后开展了地质档案的目录数据库建设、地质成果资料全文数据库建设以及地质资料管理系统建设,实现了各区域内的网络发布与利用。但各区域之间的资料查询和利用仍然较为困难,数据孤岛现象依然存在。为了解决这一问题,西南油气田决定充分利用分布式管理技术,将各区域端点的地质档案数据在中心管理平台上进行科学的组织与同步,并通过有效的手段发布分享,使之成为群体知识和共享成果,提供技术、成果互动交流的平台,实现地质档案收藏数字化、传递网络化和资源共享化。
1 西南油气田地质档案分布式管理现状
西南油气田于2006年完成地质资料管理系统节点程序开发,按区域集中方式,在四川省、云南省、贵州省及广西壮族自治区四省内按研究机构、采油气厂、测、录、钻、采、试等专业性质,部署二级站点,同时通过股份公司下达的成果地质资料涉密清理、原始和实物地质资料清理、国土资源部油气地质资料委托管理数据库建设以及西南油气田下达的成果地质资料数字化建设等工作,于2010年全面实现了油气田个单位地质档案管理的网络化发布与应用。2010年启动《西南油气田地质资料分布式管理系统》的建立与推广部署项目。在勘探开发研究院、工程设计院、广西采气厂等12个分站点建设的基础上,应用分布和协同的部署理念研发与部署分布式服务系统和二级单位地质档案管总控平台。在西南油气田范围内建成了一个庞大的跨越4个省12个单位的地质档案信息数据库,解决了西南油气田资料管理的规范化和统一性问题,实现了各单位之间资料的共享,形成一个完整的分布式环境,开创了地质资料远程管理的成功模式,提高地质档案资料的管理、使用水平,进一步完善了西南油气田地质资料发布与应用网络。在生产科研过程中,节约了成本,取得了良好的经济效益,其主要特点有如下几个方面。
1)利用网络信息资源、突破地域限制,一组相互之间在物理上距离较远的人员可以一起进行工作,有效突破地域的限制。
2)分布系统各节点的管理无须配置高性能、大容量的存储设备,可充分利用油气田各单位现有的硬件资源,分散存储,统一管理。
3)高度容错应用。分布式系统管理中的每个节点是自治的。一个单元或资源(软件或硬件)的故障不影响其他资源的正常功能。
4)扩展功能强大,通过增加节点管理的方式,能有效解决因企业发展、机构变迁所带来的影响。
5)独立管理、共享资源。各节点系统由各二级单位按照统一模式自主建设、自主管理,自主审批等方式保障了各单位的合法权益,同时通过集中发布实现资源共享。
2 西南油气田分布式系统管理应用解析
21 分布式系统概述
分布式系统(distributed system)是建立在网络之上的软件系统。正是因为软件的特性,所以分布式系统具有高度的内聚性、透明性、开放性及可扩展性。在一个分布式系统中,一组独立的计算机展现给用户的是一个统一的整体。系统拥有多种通用的物理和逻辑资源,可以动态地分配任务,分散的物理和逻辑资源通过计算机网络实现信息交换。系统中存在一个以全局的方式管理计算机资源的分布式应用系统。
分布式软件系统(Distributed Software Systems)是支持分布式处理的软件系统,是在由通信网络互联的多处理机体系结构上执行任务的系统。它包括分布式 *** 作系统、分布式程序设计语言及其编译(解释)系统、分布式文件系统和分布式数据库系统等。
分布式 *** 作系统负责管理分布式处理系统资源和控制分布式程序运行。它和集中式 *** 作系统的区别在于资源管理、进程通信和系统结构等方面。
分布式程序设计语言用于编写运行于分布式计算机系统上的分布式程序。一个分布式程序由若干个可以独立执行的程序模块组成,它们分布于一个分布式处理系统的多台计算机上被同时执行。它与集中式的程序设计语言相比有三个特点:分布性、通信性和稳健性。
分布式文件系统具有执行远程文件存取的能力,并以透明方式对分布在网络上的文件进行管理和存取。
分布式数据库系统由分布于多个计算机节点上的若干个数据库系统组成,它提供有效的存取手段来 *** 纵这些节点上的子数据库。分布式数据库在使用上可视为一个完整的数据库,而实际上它是分布在地理分散的各个节点上。
西南油气田分布式系统管理分为两个环节进行,首先在各个二级单位部署地质资料管理独立子系统,解决局部单位的资料管理、查询、借阅、下载等基本工作,其次在各个独立子系统的基础上设立一个分布式服务系统,包含了分布管理需要 *** 作系统、程序设计语言与文件系统,实现各个二级单位之间和油气田之间的有效整合,形成分布式环境(图1)。
图1 西南油气田分布管理系统图
利用WebService技术构建多层分布式应用系统的体系结构,该结构真正实现了应用系统逻辑上的多层架构和物理上的站点分布,实现了跨平台、资料负载平衡。使各个二级单位(四川、广西、云南…)Web站点的部署真正做到了不受地域限制,各个站点对资料均衡管理,以及网内用户资料共享。能够实现基于分布式系统的内容交互,为异构资源库之间的查询交互提供了一种良好的手段。基于分布式系统的资源描述和检索方法可以使资源的描述和用户的检索以一种更加语义化的方式进行,因此可以大大提高资源检索的查准率和查全率。
22 分布式系统功能架构
分布式系统功能主要为跨站点查询利用和地质资料管理系统节点配套功能两大部分。系统功能架构见图2。
图2 西南油气田分布式系统功能架构示意图
221 分布式查询利用功能
分布式查询服务模块:用户向WebService查询服务器提交查询请求,查询服务模块分析查询请求,执行数据库中数据查询和文件体查询。将查询结果组织成相应格式发给查询用户。该查询可以同时查询各个二级单位的资料,也可以查询某个单位的资料。
用户管理:该功能模块可管理加入系统的用户和用户组,系统管理员管理系统中用户的增加、修改、删除并把用户系统发送到各个二级单位,二级单位管理员根据总系统发来的用户信息进行文件授权。
借阅管理:系统可以根据用户查询资料的选择情况自动产生借阅申请单,并且自动根据资料的所属情况分为各个二级单位的借阅申请单,自动发送到各二级单位;二级单位的管理员对借阅单据审批。
数据同步接收:各个二级站点将二级单位资料的更新数据同步发送到总站点后接收同步数据,该功能是自动执行。
分布式查询服务自助管理模块:该模块工作在分布式查询服务系统中。主要是对接收的数据执行索引,释放垃圾数据,记录工作日志,对数据异常情况进行容错处理。
分布式查询服务数据备份恢复:该模块工作在分布式查询服务系统中。主要是对接收的索引数据进行备份和恢复。
222 节点系统配套功能
信息提示与发布技术:对于待审批的电子申请单或者系统异常信息,开机后提示管理员(类似MSN邮件提示)。管理员进入系统后可以执行相关的 *** 作。
数据同步发送:各个二级站点将二级单位资料的更新数据同步发送到分布式服务中心站点中,该功能是自动执行。该服务功能需要在各个二级单位的服务器上部署。
读者留言板:读者可以对管理员提出自己的要求和意见,如读者对管理员要求放开某档资料的权限,管理员看到后可以作相关的处理。
基于文件的全文查询管理:为基于文件的全文检索建立索引服务,该功能可以设置执行时间,系统会自动在指定的时间执行。
基于文件索引服务器的文件索引及全文检索过程如下:采取了提交—建索引—查找—组织结果—返回的过程来完成全文检索。一旦非结构化数据被提交到了文件服务器。索引服务程序就创建或者更新索引文件,当用户发出检索请求时,系统会从索引文件中找到符合的内容,并且到数据库中取得相关的结构化信息,最终组合并打包成资料体返回给请求者。在建立索引时,索引服务程序能够从扫描的文件中自动抽取文本内容(前提是此文件是基于文本的,例如Word文档、Excel文档,以及由文本类型的文件转换的PDF文档),这个过程见图3。
图3 西南油气田分布式系统索引流程图
23 分布式系统层次架构
系统可以分为5个层次:①资料管理系统,是系统的次顶层;②系统服务支持环境,第三层,是为系统提供服务的支撑环境。如:ORACLE数据库服务、Web服务,系统使用的组件服务;③ *** 作系统,第四层,是为系统支撑环境提供服务;④硬件和网络环境,第五层,为系统提供底层服务;⑤查询服务层,它受分公司控制,独立于各个单位系统外,为各个独立子系统的用户提供Web查询服务,其数据来源是建立在各独立子系统的资料信息的基础上的,因此它处于整个系统的最高层。
为了提高系统的工作效率以及程序与数据的安全性,我们在底层硬件方面采用了磁盘阵列和服务器双机备份。首先采用了磁盘阵列技术(RAID)可以提高了存储容量,多台磁盘驱动器可并行工作,提高了数据传输率;其次采用服务器双机备份技术,当一台服务器出现故障时,可以由另一台服务器承担服务任务,从而在不需要人工干预的情况下,自动保证系统能持续提供服务。系统软硬件整体架构见图4。
图4 西南油气田分布式系统层次整体架构图
24 分布式系统网络架构
分布式系统的基本网络工作模式主要分为服务端和客户端,其中读者通过IE浏览器(客户端)访问服务器站点,发送请求,服务器接收客户端的请求,解析后再请求数据库服务器和文件服务器提供相应的资源,获取资源后在服务端组织结果信息发送到客户端。
在分布式环境下,系统的网络架构在不改变系统的网络工作模式条件下,增加了一个WebService查询服务系统使得读者资料查询方式发生了变化,当读者查询外部二级单位资料的时候,只需要登录系统总控站点,系统获取查询请求后,转换为请求WebService查询。WebService查询服务器在服务端组织结果信息发送到客户端。
采用这样的架构优势在于可以将查询功能剥离为Web服务,为其他数据管理系统使用本系统提供的查询服务提供一个公共的接口。数据同步服务为WebService查询服务系统提供同步数据。系统总控台为系统中所有的用户提供用户管理和借阅管理服务。系统网络架构见图5。
图5 西南油气田分布式系统网络架构示意图
3 结论与建议
分布式系统是新时期互联网技术、信息技术与地质档案管理相结合的产物,通过协同办公、同步 *** 作、统一管理,有效节约资源,提升地质档案的利用效率,同时也能解决档案管理的规范化、流程化与全局资源共享等诸多问题。
分布系统管理是油田企业地质档案管理发展的重要趋势,具有较好的推广与应用价值,建议各油气田可依据自身档案管理的模式,发展分布式管理平台,同时,通过多级分布式管理程序研发,最终实现全国性的资源共享与利用。
参考文献
[1]叶幼霞福建省分布式档案网站系统的优点与不足[J]兰台世界,2011(7):20~21
[2]许桂清,李映天辽宁省分布式档案异构数据库的探索与研究[J]中国档案,2010(2):58~60
[3]时昶基于分布式数据库的档案查询系统设计[J]水利水电快报,2009(12):36~38
如果两种数据库系统之间的数据定义模型不同,如分别为关系模型和层次模型,那么需要重新定义实体属性和联系,以防止属性或联系信息的丢失。
----总之,在进行数据转换后,一方面源数据库模式中所有需要共享的信息都转换到目的数据库中,另一方面这种转换又不能包含冗余的关联信息。
----数据库转换工具可以实现不同数据库系统之间的数据模型转换,需要进一步研究的问题是:如果数据库转换同时进行数据定义模式转换和数据转换,就可能引起同一数据集合在异构数据库系统中存在多个副本,因此需要引入新的访问控制机制。在保证各个参与数据库自治,维护其完整性、安全性的基础上,对于异构数据库系统提供全局的访问控制、并发机制和安全控制。
----如果数据库转换只进行数据定义转换,不产生数据的副本,那么在新的目的数据库定义模型的框架下访问数据,实现上仍是对源数据库系统中数据的访问。这时利用新的数据库系统中的数据处理语言实现的事务,不能直接访问源数据库,必须进行事务级的翻译才可以执行。
异构网络的融合和自治是物联网的最显著特征之一。由于应用需求和网络技术的多样性,在物联网的架构下将是多种网络同时共存的局面,包括用于感知信息在内的个域网、有线和无线形式的局域网、城域网和广域网等。这些性能特征各异的网络是相互补充、相互促进的,如何实现它们之间的无缝融合和自治管理,更加有效灵活地满足用户需求是物联网面临的重要技术挑战之一。
异构网络的融合和自治从技术上讲主要包括海量地址和数据的管理,接入机制的选择和异构资源的自治管理等方面。首先,在物联网中,由于物体数目巨大带来的海量地址空间的分配和管理、物体地址和标示之间的映射、海量数据的传输和存储等成为异构网络首先需要解决的问题。其次,由于各种网络性能特征各异,采用传统的单目标决策理论很难找到真正最优的接入选择方案。因此需要引入多目标决策理论,在有限资源和各用户要求的多个目标之间找到平衡点,达到多目标最优化目的。最后,由于物联网资源的异构性、网络的动态性等特点,资源的自治管理是研究的重点内容。在以自组织为主要形式的信息传感层中,关键是自感知与自配置的核心协议,包括时间同步协议、分布式定位协议、拓扑控制协议、自组织路由协议和能量管理协议等。在接入/网络层中,为支持用户和节点的移动性,除了需要在同一网络内不同小区间的水平切换技术之外,还需要从一种网络到另一种网络的垂直切换技术。由于异构网络在数据速率、频谱、QoS等方面的差异性,垂直切换所需要的精确位置测定和快速切换机制将更加复杂。同时,在异构环境中,基于上下文感知技术,进行分布式频谱(带宽)的自感知动态分配也是资源管理的趋势之一。多无线电协作(MRC)是实现上述资源管理的一项关键技术,它是指在单一节点配备多个独立的无线电系统,各无线电系统可以使用不同的接入技术及不同信道。由于一个节点可以同时与不同的接入系统建立连接,也可以同一时刻与一个接入系统保持多个连接,因而有助于实现快速垂直切换和动态资源分配。
(1)数据融合和信息处理
物联网中的节点具有数目多、体积小、能量有限、数据海量等特点,因此从提高信息准确度和降低能耗角度出发,需要有效的数据融合和信息处理技术。这些技术渗透在物联网的各个层次中。在信息感知层,可以通过移动中继、节点分组轮流工作、选取代表性上报节点、压缩感知等机制达到节能目的,同时又保证了信息的完整性和准确性;在接入/网络层,主要是通过汇聚处理和各种路由控制协议来进行数据重组和融合,减少数据传输量;在应用服务层,则主要是利用分布式数据库技术,对收到的数据进行进一步的筛选,达到数据融合的目的;同时,根据用户和环境数据信息随时空变化的动态特性,对其进行基于多层次融合的上下文感知处理。
(2)服务搜索和发现
和传统的电信网、互联网服务模式相比,物联网服务的不同之处在于强调服务的主动性提供,因此需要更高级、更复杂的服务搜索和发现技术。目前的Web服务搜索和发现技术主要有直接搜索、集中架构式搜索和分布架构式搜索三大类。直接搜索是指使用者向服务提供者直接索要服务描述的副本;集中式架构搜索是指服务提供者在一个中心目录中注册服务、发布服务公告及引用,供使用者检索;分布架构式搜索是指在Web站点上存有对服务提供者提供点处的服务描述的引用,使用者通过指定检查Web站点来获得可用的Web服务。物联网服务的搜索和发现需要在以上技术基础上增加主动性环节,即根据用户需求,自动搜索、发现和组装合适的服务,并在动态变化的异构网络环境中实现服务的可靠传送和主动提供。
(3)安全可靠性保障
物联网中的安全可靠性保障主要体现在网络安全和信息安全两方面。网络安全包括硬件平台、 *** 作系统、应用软件在内的系统安全和系统连续可靠正常运行、网络服务不中断的运行安全。信息安全则是指对信息的精确性、真实性、机密性、完整性、可用性和可控性的保护。和传统的互联网相比,由于节点的微型化和能量能力的受限化,在物联网中需要着重考虑的是算法计算强度和安全强度之间的权衡问题,即如何通过更简单的算法和更低能耗实现尽量强大的安全性。
以上就是关于分布式系统在油气田地质档案管理中的应用研究全部的内容,包括:分布式系统在油气田地质档案管理中的应用研究、异构数据库的结构冲突、物联网中的异构网络融合包括哪些等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)