关系数据库中如何存储xml数据_工具

XML文档的一个普通存在的问题是如何持久保存(Persist) XML文档。在一个关系数据库中存储XML文档是一个非常常用的方法，因为当前关系数据库的使用非常广泛。

将XML文档插入到数据库中不是简单的方法，这其中需要很多其它额外的考虑。现在我提供了一些技巧，你可以使用这些技巧在关系数据库中存储XML文档。

1、文档表：

一个最简单和容易的方法是，在一个具有单一文本域的数据库中建立一个表，由此你可以在表中存储XML数据。由于这些特定数据库和特定XML文档，这一文本域可以是一个二进制大型对象(BLOB，binary large object)。有些数据库需要存储的是大量的BLOB数据而不是文本。

这一方法的优点是，将数据存入表中变得相当简单，而且重新获得也同样很容易。这种文档表的管理也很方便。

这种方法的缺点在于你将可能无法进行一些有用的文本搜索，并且在放置特定文档时也会碰到困难，因为没有任何方法来识别表中的文档；

2、主键表：

下一个比较复杂的方法是使用一个主键表(keyed table)。这种方法与文档表非常相似，但此时你的表中包含两个域：一个唯一的主键和XML文档。使用这种方法，你既可以具有存储和获得整个XML文档的简洁性，也可以使用一些管理这些唯一主键的复杂 *** 作；

建立主键的一种通用方法是使用XML文档中的MD5求和检验。请记住如果你想在表中包括多份XML文档，这一方法远不足够。在这种情况下，你可以添加额外的key fields标识键列。

与文档表一样，主键表很容易执行，它可以在表中查找特定的文档。然而，与文档表一样，你仍然不能执行任何文本查询；

3、有限离散表：

这一方法更加复杂，但它给你带来更多的灵活性。使用有限离散表，你可以建立用于存储有限分散的XML信息的表，这是什么意思？请看以下的例子：

假设你具有一个顺序文档。在文档的根部(Root)有一个Order元素，这一元素包括CustomerInfo, ItemInfo, 以及hippingInfo元素。在数据库中，你可以建立一个OrderDoc表，表中包含一个ID域，一个CustomerInfoId域，一个ItemInfoId域，一个ShippingInfoId域。然而，你还可以建立一个CustomerInfoId表，一个ItemInfoId表，一个ShippingInfoId表。这些表都包含很多信息相关的各自的ID域，这些信息包括用户，选项，邮寄信息。在这一表中，还包含着其它额外的等级。比如，CustomerInfo表包含AddressInfo域，即从AddressInfo表中引用的入口。

这种方法的优点是，允许你更紧密地建立XML数据的模型。这种方法使得你进行数据的一些成熟的查询。它也使得数据的使用性更强，因为你不再需要XML分析器来读取数据。

不足之处是这种方法需要更多的精力来开发和维护。这意味着每一文档都需要解析成分离的部分，然后存储在数据库中。如果这一过程没有得以很好管理，有可能会丢失一些数据。而且，这也意味着，当从一个数据库中获得一个XML文档时，你不得不连接这些分散的部分。

[delphi中如何将XML保存到数据库中]这要看你要保存到数据库的XML规范文件，而规范文件又分简单和复杂的,可以根据数据库管理员提供的标准XML，做XML文本文件。XML的每一行中每一个节点哪些可以更改，哪些不能更改。。。如Dim sRoot As MSXML2IXMLDOMElement ，sRootsetAttribute "COMPATIBLE_REV", "" 你要需要看XML的编写方法的书籍，电脑装个接口引擎，再调传网数据。。。。。。我自己以前刚做这些也用了好几天才搞定。例子我用VB写的，只说明如何定义IXMLDOMElement，怎样做节点。

数据库技术及其应用系统经历了从层次数据库网状数据库到关系数据库以及面向对象数据库的发展在传统的商业和事务处理领域内逐步成熟取代了原有的基于文件系统的数据处理方式成为计算机信息系统中的重要基础和支柱但随着Internet的飞速发展 Web的出现改变了人们习惯的处理方式也给数据库技术提出了必须面对的重要问题即如何有效地存储和管理Web上的数据(文档) 使其既能被高效地 *** 作和维护又能在Internet平台上方便地表示和交换

XML技术自出现以来发展非常迅速在许多领域内得到广泛的支持而有着广阔的应用前景例如电子数据交换电子商务等更是将XML作为一种基础性支柱性的技术来看待

数据库简史

数据库系统是随着计算机技术的不断发展在特定的历史时期特定的需求环境下出现的在年的第一台计算机到世纪年代这漫长的年里计算机 *** 作系统主要局限于文件的 *** 作对数据的管理也主要是通过文件系统来实现进行计算所需要的各种数据存放在各自的文件里使用这些数据时将文件打开读取文件中的数据到内存中当计算完毕后将计算结果仍旧写入到文件中去它的不足主要集中在无法对数据进行有效的统一管理针对文件系统的重要缺点人们逐步发展了以统一管理数据和共享数据为主要特征的系统即数据库系统年美国通用电气公司开发成功了世界上的第一个数据库系统IDS(IntegratedDataStore) IDS奠定了网状数据库的基础并得到了广泛的发行和应用成为数据库系统发展史上的一座丰碑年美国国际商用机器公司(IBM)也推出世界上第一个层次数据库系统IMS(InformationManagement System) 同样在数据库系统发展史上占有重要的地位

年代初 E F Codd在总结前面的层次网状数据库优缺点的基础上提出了关系数据模型的概念及关系代数和关系演算在年代关系数据库系统无论从理论上还是实践上都取得了丰硕的成果在理论上确立了完整的关系模型理论数据依赖理论和关系数据库的设计理论在实践上世界上出现了很多著名的关系数据库系统比较著名的如SystemR INGRES Oracle等

与文件系统相比数据库系统有几个方面的特点向用户提供高级的接口向用户提供非过程化的数据库语言(即SQL语言) 查询的处理和优化并发控制数据的完整性约束

进入年代之后计算机硬件技术的飞速提高促使计算机应用不断深入产生了许多新的应用领域例如计算机辅助设计计算机辅助制造计算机辅助教学办公自动化智能信息处理决策支持等这些新的领域对数据库系统提出了新的要求但由于应用的多元化不能设计出一个统一的数据模型来表示这些新型的数据及其相互关系因而出现了百家争鸣的局面产生了演绎数据库面向对象数据库分布式数据库工程数据库时态数据库模糊数据库等新型数据库的研究和应用

XML简介

XML推荐标准版发布于年月之后迅速在全球掀起了XML应用的浪潮 XML是一种描述型的标记语言与HTML同为SGML(标准通用标记语言 ISO 国际标准)的一种应用由于XML在可扩展性可移植性和结构性等方面的突出优点它的应用范围突破了HTML所达到的范围

一篇XML文档由标记和内容组成 XML中有六种标记元素(elements) 属性(attributes) 实体引用(entityreferences) 注释(ments) 处理指令(processinginstructions)和CDATA段(CDATAsections) XML与HTML最显著的不同是XML文档中引入了文档类型声明 (Document Type Declarations) DTD使文档可以与分析器交流关于它的内容的元信息 DTD的出现赋予了XML文档可扩展性结构性和可验证性使XML具备了类似于数据库的一些性质可以利用XML来组织和管理信息又可以与HTML一样在浏览器中方便地表示在Internet上高效地传递和交换考虑到与HTML的兼容 DTD并不是XML文档必需的成份具有DTD的XML文档称作 Valid 否则就是 Well formed

目前处理XML文档的方式主要有SAX与DOM两种 SAX(SimpleAPIforXML)是一种基于流的以事件处理方式工作的接口 SAX 在年月发布增强了许多功能包括对名字空间的支持 DOM(Document Object Model)则是在对XML文档进行分析后在内存中建立起一个完整的树结构然后在此基础上进行各种 *** 作简单地比较来看 SAX对系统资源要求低速度快但对文档的 *** 作是只读的 DOM的处理能力强大但要求大量的系统资源尤其是对于大的文档而后还出现了Xpath和Xpointer用以完成XML的搜索和转换 XSL XSLT和SOAP用以完成XML的远程对象访问 XML Query Languages的出现使XML查询语言可用于任何XML文档

XML与数据库

XML文件是数据的集合它是自描述的可交换的能够以树型或图形结构描述数据 XML提供了许多数据库所具备的工具存储(XML文档) 模式(DTD XMLschema RE AXNG等) 查询语言(XQuery XPath XQL XML QL QUILT等) 编程接口(SAX DOM JDOM)等但XML并不能完全替代数据库技术 XML缺少作为实用的数据库所应具备的特性高效的存储索引和数据修改机制严格的数据安全控制完整的事务和数据一致性控制多用户访问机制触发器完善的并发控制等因此尽管在数据量小用户少和性能要求不太高的环境下可以将XML文档用作数据库但却不适用于用户量大数据集成度高以及性能要求高的作业环境

随着Web技术的不断发展信息共享和数据交换的范围不断扩大传统的关系数据库也面临着挑战数据库技术的应用是建立在数据库管理系统基础上的各数据库管理系统之间的异构性及其所依赖 *** 作系统的异构性严重限制了信息共享和数据交换范围数据库技术的语义描述能力差大多通过技术文档表示很难实现数据语义的持久性和传递性而数据交换和信息共享都是基于语义进行的在异构应用数据交换时不利于计算机基于语义自动进行正确数据的检索与应用数据库属于高端应用需要昂贵的价格和运行环境而随着网络和Internet的发展数据交换的能力已成为新的应用系统的一个重要的要求 XML的好处是数据的可交换性(portable) 同时在数据应用方面还具有如下优点 ( )XML文件为纯文本文件不受 *** 作系统软件平台的限制 ( )XML具有基于Schema自描述语义的功能容易描述数据的语义这种描述能为计算机理解和自动处理 ( )XML不仅可以描述结构化数据还可有效描述半结构化甚至非结构化数据

XML文件的存储

XML文件的存储方式有三大类 ( )将文件存储于文件系统(StoringDocumentsinthe File System) ( )将文件存储于BLOB(Storing Documents in BLOBs) 利用数据库的事务管理安全多用户访问等优点此外许多关系数据库提供的检索工具可以进行全文检索近似检索同义词检索和模糊检索其中某些工具将会支持XML 这样就可消除将XML文件作为纯文本检索所带来的问题 ( )将文件存储于原生XML数据库(Native XML Databases NXD) NXD是专用于存储XML文件的数据库支持事务管理安全多用户访问编程API和查询语言等与其它数据库的唯一区别在于其内部模型是基于XML的其中最重要的存储方式当属原生XML数据库

原生XML数据库

原生XML数据库(NativeXMLDatabases)为XML文档定义了一个(逻辑)模型并根据该模型存取文件这个模型至少应包括元素属性 PCDATA和文件顺序其例子有XPath数据模型 XMLIn foset以及DOM所用的模型和SAX 的事件它以XML文件作为其基本存储单位对底层的物理存储模型没有特殊要求例如它可以建在关系型层次型或面向对象的数据库之上或者使用专用的存储格式比如索引或压缩文件

NXD最适于存储以文档为中心的文件这是由于NXD保留了文件顺序处理指令注释 CDA TA块以及实体引用等而支持XML的数据库XED(XML enableddatabase)无法做到 XED是在原有数据库基础上扩展了XML支持模块完成XML数据和数据库之间的格式转换和传输从存储粒度上可以把整个XML文档作为RDBMS表中一行或把XML文档进行解析后存储到相应的表格中为了支持W C的一些XML *** 作标准 Xpath XED提供一些新的原语(如Oracle iR 增加了一些数据包来 *** 作XML数据等) 并优化了XML处理模块

NXD一般采用层次数据存储模型保持XML文档的树形结构省掉了XML文档和传统数据库的数据转换过程 NXD还适用于存储天然格式为XML的文件 NXD还可以存储半结构化数据在某种特定情形下提高存取速度以及存储没有DTD的文件(良构的文件)

原生XML数据库的结构

原生XML数据库的结构可分为两大类基于文本的和基于模型的

基于文本的NXD(Text BasedNativeXMLDatabases)将XML作为文本存储它可以是文件系统中的文件关系数据库中的BLOB或特定的文件格式基于文本的NXD与层次结构的数据库很相似当存取预先定义好层次的数据时它比关系数据库更胜一筹和层次结构的数据库一样当以其它形式比如转置层次存取数据时 NXD也会遇到麻烦这个问题的严重程度尚未可知很多关系数据库都使用逻辑指针使相同复杂度的查询以相同的速度完成

基于模型的NXD(Model BasedNativeXMLDatabases)是根据文件构造一个内部模型并存储这个模型有些数据库将该模型存储于关系型和面向对象的数据库中例如在关系型数据库中存储DOM时就会有元素属性 PCDATA 实体实体引用等表格其他数据库使用了专为这种模型优化了的存储格式使用专用存储格式的基于模型的NXD如果以文件的存储顺序读取文件其性能与基于文本的NXD相似

原生XML数据库的特性

原生XML数据库的特性(FeaturesofNativeXML Databases)有 ( )文件集(Document Collections) 支持集合(Collection)的概念其作用相当于关系数据库中的表和文件系统中的文件夹 ( )查询语言(Query Languages) 最常用的有XPath(对多个文件的查询作了扩充)和XQL 以及专有的查询语言 ( )更新和删除(Updates and Deletes) NXD对文件的更新和删除方式从简单的替换或删除现有文件到修改当前活动的DOM树以及用于指定如何修改文件片断的语言 ( )事务锁定和并发(Transactions Locking and Concurrency) 支持事务处理锁定通常是对整个文档的所以多用户并发性相对较低问题的大小取决于应用程序以及文件的构成 ( )原生数据库提供应用程序接口API(Application Programming Interfaces APIs) ( )NXD的一个重要特性是它可以为XML文档提供往返车票(round trip) 可以将XML文件存放在NXD中而且再取回同样的文件对于以文档为中心的应用程序来说非常重要因为CDATA部分实体用法注释和处理指令是这些文档不可缺少的组成部分特别是对于法律和医学文件按规定这些文档必须要保持原样 ( )外部数据(Remote Data) 某些NXD可包含有外部数据它来自存储在数据库中的文档通常这些数据通过OD BC OLE DB或JDBC从关系数据中取出模型可以是基于表格的或对象关系型映射 ( )支持元素和属性的索引

结论

XML技术的出现使数据处理从文件方式到数据库系统再到文件方式的循环但新的文件方式已经与最初的文件系统有了本质的区别格式化文档 XML和关系数据库在数据应用和数据管理方面各有优势

lishixinzhi/Article/program/net/201311/12776

简单步骤分步阅读

下载 WikiTaxi 和离线维基百科数据库

在你使用 WikiTaxi 之前，必须先下载它和维基百科的离线数据库，我们提供了简化版的英文版、完整英文版和中文版的维基数据库供大家下载，下载链接位于文章结尾处，请根据自己的需求选择下载。不过数据比较大，并且服务器位于国外，速度有点不尽人意，只能有点耐心吧。

导入维基数据库到 WikiTaxi

因为维基百科提供的离线数据库(xmlbz2)文件格式 WikiText 并不能直接使用，所以我们需要先将数据库转换成 WikiTaxi 的 taxi 格式。下载解压 WikiTaxi 之后你可以看到一个 WikiTaxi_Importerexe 的文件，双击运行它。简单来说，它就是一个转换数据库格式的工具。使用方法和简单，第一项选择 xmlbz2 文件，第二项选择要保存转换好的taxi文件，然后按 Import Now 即可开始。中间那个横条是用来调整分配多少内存给该工具来进行转换工作，当然能用的内存越多，转换速度也就也快了。转换好之后，如没特别需要，之前那个xmlbz2的文件你可以删除掉了。

运行 WikiTaxi

如果你已经制作好taxi数据库之后，那么双击运行 wikitaxiexe ，在菜单里选择 “Options”-> “Open taxi Database”来打开刚才那个制作好的taxi数据库文件即可。然后，就没然后了，你现在已经拥有一个离线的维基百科数据库了！想查询什么直接搜索就行了。

使用方法

WikiTaxi首先需要Wikipedia的数据文件，比如在这里可以下载英文版本的备份导出文件：

XML数据是Web上数据交换和表达的标准形式和关系数据库相比 XML数据可以表达具有复杂结构的数据比如树结构的数据正因为此在信息集成系统中 XML数据经常被用作信息转换的标准

管理三大领域数据

基于XML数据的特点 XML数据的高效管理通常有着以下的应用

复杂数据的管理

XML可以有效地表达复杂的数据这些复杂的数据虽然利用关系数据库也可以进行管理但是这样会带来大量的冗余比如说文章和作者的信息如果利用关系数据库需要分别用关系表达文章和作者的信息以及这两者之间的关系这样的表达在文章和作者关系的关系中分别需要保存文章和作者对应的ID 如果仅仅为了表达文章和作者之间的关系这个ID是冗余信息在XML数据中对象之间的关系可以直接用嵌套或者ID IDREF的指向来表达此外XML数据上的查询可以表达更加复杂的语义比如XPath可以表达比SQL更为复杂的语义因此利用XML对复杂数据进行管理是一项有前途的应用

互联网中数据的管理

互联网上的数据与传统的事务数据库与数据仓库都不同其特点可以表现为模式不明显经常有缺失信息对象结构比较复杂因此在和互联网相关的应用特别是对从互联网采集和获取的信息进行管理的时候如果使用传统的关系数据库存在着产生过多的关系关系中存在大量的空值等问题而XML可以用来表达半结构数据对模式不明显存在缺失信息和结构复杂的数据可以非常好的表达特别在许多web系统中 XML已经是数据交换和表达的标准形式因此XML数据的高效管理在互联网的系统中存在着重要的应用

信息集成中的数据管理

现代信息集成系统超越了传统的联邦数据库和数据集成系统需要集成多种多样的数据源包括关系数据库对象关系数据库以及网页和文本形式存在的数据对于这样的数据进行集成 XML这样既可以表达结构数据也可以表达半结构数据的形式成为首选而在信息集成系统中为了提高系统的效率需要建立一个cache 把一部分数据放到本地在基于XML的信息集成系统中这个cache就是一个XML数据管理系统因此XML数据的管理在信息集成系统中也有着重要的应用

开发难点解决之道

在实际的XML数据库以及基于XML的信息集成系统的开发过程中笔者遇到了一些技术难点在解决这些难点的过程中有一些经验是值得借鉴的参考的

关系数据库中复杂查询的优化

在基于关系数据库的XML数据管理系统中在没有建立索引的情况下系统的性能非常低为了提高系统的性能我们在编码上建立了索引经过分析由于在系统中最常做的 *** 作是a x b y的join *** 作最好的选择是建立二维索引由于我们的后端数据库没有对二维索引的支持我们选择了在x和y属性上分别建立B+树的方法使得系统性能得到了提高此外我们发现在对嵌套查询进行翻译的过程中如果嵌套查询的结果可能过大对嵌套查询的结果建立临时表可以提高系统的性能

经验总结对于一个数据库应用需要对其workload进行分析根据workload建立索引对于执行效率很慢的查询或查询集合可以通过分析查询计划找出系统的瓶颈进行处理

复杂数据库系统的调试

在调试XML数据的管理系统中多次出现了小规模数据执行准确效率很高而大规模数据执行错误或执行效率很低的情况对于这种情况我们采取了定位错误猜测错误继而加以解决的策略也就是首先确定出现错误的 *** 作使得错误的出现具有可重复性然后通过逐步删减数据确定数据出现在哪些数据上这样就使得调试设计的 *** 作和数据的规模大大减小了然后根据经验对错误进行猜测逐步排除错误

经验总结对于数据规模大 *** 作复杂的数据库系统的调试首要任务是让错误可以重现然后把次要因素逐步排除最后发现问题的所在

复杂数据库系统的测试

由于系统需要处理各种各样的XML上的查询为了确保系统的健壮性需要选取多种具有代表性的查询对系统进行测试为了选取这样的查询我们考察了XML上影响查询的不同参数包括查询的长度查询中包含的关系种类查询的选择性和查询中约束条件的选择性根据这些参数我们分别选择有代表性的查询对系统进行测试

lishixinzhi/Article/program/net/201311/12558

这是风牛马不相及的两个概念，他们的结构，应用范围是完全不同的，目前的数据库基本上都是关系型数据库，以sql与oracle为代表，都是非常大型的，可以进行数据的海量存储；而xml主要解决的是数据在网上传输标准的问题，把原来各种各样的数据孤岛可以通过xml这座桥梁连接起来，所以打个比方，数据库就好比是盛数据的桶，而xml则是数据传输转换的桥梁，所以数据库是数据库，xml是xml，二者是截然不同的，当然二者也存在非常紧密的联系，毕竟都是处理数据的工具，就是很多其他的数据格式可以通过xml输入到数据库中，数据库中的关系型数据也可以通过xml转化成其他的数据格式

所以，不要因为他们都与数据有关，就把他们混为一谈

以上就是关于关系数据库中如何存储xml数据全部的内容，包括:关系数据库中如何存储xml数据、delphi中如何将XML保存到数据库中读出并且可以保存的数据读出保存到XML中、XML技术与数据库的发展趋势分析等相关内容解答，如果想了解更多相关内容，可以关注我们，你们的支持是我们更新的动力！

欢迎分享，转载请注明来源：内存溢出

原文地址:https://54852.com/sjk/9538336.html

关系数据库中如何存储xml数据

发表评论

评论列表（0条）