怎样将XML文件导入数据库_sql

要用php 把XML数据导入mysql ，xml里所有的数据导入数据库

我在php手册里找了个例子

to import xml into mysql

$file = "article_2_3032005467.xml"

$feed = array()

$key = ""

$info = ""

function startElement($xml_parser, $attrs ) {

global $feed

}

function endElement($xml_parser, $name) {

global $feed, $info

$key = $name

$feed[$key] = $info

$info = ""}

function charData($xml_parser, $data ) {

global $info

$info .= $data}

$xml_parser = xml_parser_create()

xml_set_element_handler($xml_parser, "startElement", "endElement")

xml_set_character_data_handler($xml_parser, "charData" )

$fp = fopen($file, "r")

while ($data = fread($fp, 8192))

!xml_parse($xml_parser, $data, feof($fp))

xml_parser_free($xml_parser)

$sql= "INSERT INTO `article` ( `"

$j=0

$i=count($feed)

foreach( $feed as $assoc_index =>$value )

{

$j++

$sql.= strtolower($assoc_index)

if($i>$j) $sql.= "` , `"

if($i <=$j) {$sql.= "` ) VALUES ('"}

}

$h=0

foreach( $feed as $assoc_index =>$value )

{

$h++

$sql.= utf8_decode(trim(addslashes($value)))

if($i-1>$h) $sql.= "', '"

if($i <=$h) $sql.= "','')"

}

$sql=trim($sql)

echo $sql

楼主首先我们应该明白xml的作用：

XML的简单使其易于在任何应用程序中读写数据，这使XML成为数据交换的唯一公共语言，虽然不同的应用软件也支持其它的数据交换格式，但不久之后他们都将支持XML，那就意味着程序可以更容易的与Windows、Mac OS, Linux以及其他平台下产生的信息结合，然后可以很容易加载XML数据到程序中并分析他，并以XML格式输出结果。

————————————————————————

由上面我们可以得知，XML成为数据交换的唯一公共语言，异构系统甚至异构平台的信息交互都要靠xml传输数据，举个例子：

.net 开发的系统和 java开发的系统如何进行数据交换，如何进行深度整合和互 *** 作，考得就是webservice，而现在webservice数据格式一般都是采用xml的，因为xml是数据交换的事实上的工业标准了，通过它我们可以“穿透那个可亲又讨厌的防火墙”. 呵呵

数据一般都是从数据库中取出的吧，所以研究xml与数据库数据的互相转化和映射关系，就显的非常重要了。

————————————————————————

XML在Web领域已经得到了广泛的应用，而XML数据库一直是个研究热点。各数据库厂商及研究机构纷纷投入对XML技术的研究及开发。大体上可以把XML数据库分为两类：原生XML数据库(Native XML Database)和使能XML数据库(Enable XML Database)。而XML数据一般可划分为粗粒度、中粒度及细粒度三种形式。以文档为中心的粗粒度形式，一般采用原生XML数据库，而以数据为中心的细粒度形式一般采用使能XML数据库。

XML数据是嵌套的树形结构，而关系数据库是简单、平面的二维表结构，结构的差异性，使得在存储XML数据时需要按一定的映射规则进行转换，并使能够恢复到原XML文件。

XML文件物理结构上由多种元素组成，本文的研究只考虑常用的ELEMENT、TEXT、ATTRIBUTE三种元素，采用三个表来保存XML数据。主要思想是把树结构中的中间节点(非属性和文本节点)放入mNode(Middle Node)表，叶子节点(属性和文本节点)放入eNode(End Node)表，另外一个是ePath表，用于保存从根节点到叶子节点的路径。当然保存多个XML时，我们会引入一个用于保存区分各个XML的表。详细说明如下：

1) Path(pathID, path)

该表主要保存从根结点到各个叶子结点的所有不同的路径，在查询时可满足类似于Xpat的查询。

pathID：各不同的路径标识符，在解析过程中产生。

path：实际路径名称。

2)mNode(nodeID, nodeName, parentID, order, pathID)

该表主要通过指定parentID来保存各节点间的父子关系，以保持原XML的树型结构。

nodeID：节点的唯一标识符，在解析过程中产生。

nodeName：节点的名称，即XML中的实际名称。

parentID：父节点的标识符，根节点置为-1。

order：兄弟节点的先后次序。

pathID：从根结点到本节点所走的路径。

3)eNode(nodeName, nodeValue, parentID, order, type)

该表主要保存属性及文本节点的值。

nodeName：属性名，如果是文本节点则取其父节点名。

nodeValue：属性文本值。

parentID：父节点的标识符。

order：兄弟节点的先后次序。

type：用于区分属性还是文本的标量。

4转换方法

从XML到SQL，一般都是采用递归算法，先根遍历XML树结构，而从SQL返回到XML时，一般采用队列生成XML节点。递归过程一般要消耗较多的时间和空间，在处理较大结构的XML时，性能上不是很理想。

本模型在XML和SQL中放入一个中间层，该层中主要有根据DTD或Schema生成的一系列Bean、一个 *** 作SQL的模块、一个 *** 作XML的模块，另外在此基础上还可以方便扩展给其他业务逻辑层调用的模块。结构如下图所示:

JavaBeans：这里所说的JavaBeans是根据XML 对应的DTD或Schema所产生的有级联关系的类。通过这些类逻辑上形成一棵XML树形结构，用于存放实际XML数据。对于如下的一部分DTD：

<! ELEMENT book (title, price, author+)>

<! ATTLIST book year CDATA>

<! ELEMENT title (#PCDATA)>

<! ELEMENT price (#PCDATA)>

我们可以设计一个BookItem类，它包括一个TitleTxt字段、一个PriceTxt字段、一个AuthorBean字段以及一个YearAttr字段，其中AuthorBean由多个AuthorItem组成，类似的，AuthorItem包含它下面的节点信息。在这个过程中，可以完成ePath表的信息建立。

根据前面的映射模型，对于BookItem类的title字段，设计如下形式的类结构：

Public Class BookItem(){

Private String titleTxt

Public setTitleTxt(String title){}

Public getTitleTxt(){}

Public setTitleParentID(int parentID){}

Public getTitleParentID(){}

Public setTitleOrder(){int order}

Public getTitleOrder(){}

…

}

而对于AuthorBean类，类结构设计如下：

Public Class AuthorBean(){

Private Vector beanVector

Public void add(AuthorItem authorItem){}

Public AuthorItem getByIndex(int index){}

Public int getSize(){}

…

}

从结构上容易看出，代码量非常大，但由于都是一些get()和set()方法，这些代码不用通过手工去撰写，而是根据DTD或Scheme的信息自动生成。在过程①及过程④中调用set()方法，在过程②及过程③中调用get()方法。

XML Operator：该模块可以支持DOM、SAX解析。根据层次信息依次解析每个节点，此过程中记录父子节点关系，并且记录一个节点中所有子节点的先后顺序，并设定到Bean中。

SQL Operator：该模块主要是把Bean中的信息写入数据库，以及从数据库中读取信息供重组XML。

楼主，希望我的给出信息和资料对你的问题的解决有所帮助！：-）

欢迎分享，转载请注明来源：内存溢出

原文地址:https://54852.com/sjk/9895092.html

怎样将XML文件导入数据库

发表评论

评论列表（0条）