
一、摇篮和萌芽阶段:首先使用"DataBase"一词的是美国系统发展公司在为美国海军基地在60年代研制数据中引用。
1963年,C·W·Bachman设计开发的IDS(IntegrateDataStore)系统开始投入运行,它可以为多个COBOL程序共享数据库。
1968年,网状数据库系统TOTAL等开始出现;
1969年,IBM公司McGee等人开发的层次式数据库系统的IMS系统发表,它可以让多个程序共享数据库。
1969年10月,CODASYL数据库研制者提出了网络模型数据库系统规范报告DBTG,使数据库系统开始走向规范化和标准化。正因为如此,许多专家认为数据库技术起源于20世纪60年代末。数据库技术的产生来源于社会的实际需要,而数据技术的实现必须有理论作为指导,系统的开发和应用又不断地促进数据库理论的发展和完善。
二、发展阶段:20世纪80年代大量商品化的关系数据库系统问世并被广泛的推广使用,既有适应大型计算机系统的,也有适用与中、小型和微型计算机系统的。这一时期分布式数据库系统也走向使用。
1970年,IBM公司SanJose研究所的E·F·Code发表了题为"大型共享数据库的数据关系模型"论文,开创了数据库的关系方法和关系规范化的理论研究。关系方法由于其理论上的完美和结构上的简单,对数据库技术的发展起了至关重要的作用,成功地奠定了关系数据理论的基石。
1971年,美国数据系统语言协会在正式发表的DBTG报告中,提出了三级抽象模式,即对应用程序所需的那部分数据结构描述的外模式,对整个客体系统数据结构描述的概念模式,对数据存储结构描述的内模式,解决了数据独立性的问题。
1974年,IBM公司SanJose研究所研制成功了关系数据库管理系统SystemR,并且投放到软件市场。
1976年,美籍华人陈平山提出了数据库逻辑设计的实际(体)联系方法。
1978年,新奥尔良发表了DBDWD报告,他把数据库系统的设计过程划分为四个阶段:需求分析、信息分析与定义、逻辑设计和物理设计。
1980年,J·D·Ulman所著的《数据库系统原理》一书正式出版。
1981年E·F·Code获得了计算机科学的最高奖ACM图林奖。
1984年,DavidMarer所著的《关系数据库理论》一书,标志着数据库在理论上的成熟。
三、成熟阶段:80年代至今,数据库理论和应用进入成熟发展时期易观国际发布《IT产品和服务-2007年中国数据库软件市场数据监测》,考察了中国数据库管理软件市场。数据显示,中国商业数据库市场2007年度整体规模达到2172亿人民币,比去年同期增长15%。从厂商竞争格局来看,国际软件巨头占据市场的绝大多数份额。Oracle、IBM、Microsoft和Sybase牢牢占据国内数据库软件市场前四位,拥有938%的市场份额。国产数据库的市场份额在本季度继续提升,正在抓住国家提倡自主创新的机遇,以“有自主知识产权”的产品为契机,满足部委和地方政府的信息整合平台需求。2008年,中国商业数据库市场整体规模达到了2825亿元,比上个年度增长了30%,一方面,主要是因为中国电子政务建设的大幅增加,以及中国政府对版权的高度重视。其中,Oracle占据了其中44%的市场份额,IBM占据了其中20%的份额、微软占据了18%的份额,Sybase占据了10%,而国产数据库因为在政府的支持下,已经占据了8%的市场份额,较2007年同比提升了25%。其中,达梦数据库年销售额为6600万元,为国产数据库中市场份额最大的。预计中国商业数据库市场在2009年达到31亿元的市场规模,同时,国产数据库在中国政府鼓励自主创新的基础下,会占据更大的市场份额。另外,包括Mysql等开源数据库也占据了大量的政府及中小企事业用户,同时,盗版数据库更是占据了中国数据库市场的较大份额,其数值不亚于整个商业数据库的市场份额。
(1)存储记录结构设计综合分析数据存储要求和应用需求,设计存储记录格式
(2)存储空间分配存储空间分配有两个原则:①存取频度高的数据尽量安排在快速、随机设备上,存取频度低的数据则安排在速度较慢的设备上
②相互依赖性强的数据尽量存储在同一台设备上,且尽量安排在邻近的存储空间上
从提高系统性能方面考虑,应将设计好的存储记录作为一个整体合理地分配物理存储区域
尽可能充分利用物理顺序特点,把不同类型的存储记录指派到不同的物理群中
(3)访问方法的设计一个访问方法包括存储结构和检索机构两部分
存储结构限定了访问存储记录时可以使用的访问路径;检索机构定义了每个应用实际使用的访问路径
(4)物理设计的性能评价①查询响应时间从查询开始到有结果显示之间所经历的时间称为查询响应时间
查询响应时间可进一步细分为服务时间、等待时间和延迟时间
在物理设计过程中,要对系统的性能进行评价
性能评价包括时间、空间、效率、开销等各个方面
⊙CPU服务时间和I/O服务时间的长短取决于应用程序设计
⊙CPU队列等待时间和I/O队列等待时间的长短受计算机系统作业的影响
⊙设计者可以有限度地控制分布式数据库系统的通信延迟时间
②存储空间存储空间存放程序和数据
程序包括运行的应用程序、DBMS子程序、OS子程序等
数据包括用户工作区、DBMS工作区、OS工作区、索引缓冲区、数据缓冲区等
存储空间分为主存空间和辅存空间
设计者只能有限度地控制主存空间,例如可指定缓冲区的分配等
但设计者能够有效地控制辅存空间
③开销与效率设计中还要考虑以下各种开销,开销增大,系统效率将下降
⊙事务开销指从事务开始到事务结束所耗用的时间
更新事务要修改索引、重写物理块、进行写校验等 *** 作,增加了额外的开销
更新频度应列为设计的考虑因素
⊙报告生成开销指从数据输入到有结果输出这段时间
报告生成占用CPU及I/O的服务时间较长
设计中要进行筛选,除去不必要的报告生成
⊙对数据库的重组也是一项大的开销
设计中应考虑数据量和处理频度这两个因数,做到避免或尽量减少重组数据库
在物理设计阶段,设计、评价、修改这个过程可能要反复多次,最终得到较为完善的物理数据库结构说明书
建立数据库时,DBA依据物理数据库结构说明书,使用DBMS提供的工具可以进行数据库配置
在数据库运行时,DBA监察数据库的各项性能,根据依据物理数据库结构说明书的准则,及时进行修正和优化 *** 作,保证数据库系统能够保持高效率地运行
6
程序编制及调试在逻辑数据库结构确定以后,应用程序设计的编制就可以和物理设计并行地展开程序模块代码通常先在模拟的环境下通过初步调试,然后再进行联合调试
联合调试的工作主要有以下几点:(1)建立数据库结构根据逻辑设计和物理设计的结果,用DBMS提供的数据语言(DDL)编写出数据库的源模式,经编译得到目标模式,执行目标模式即可建立实际的数据库结构
(2)调试运行数据库结构建立后,装入试验数据,使数据库进入调试运行阶段
运行应用程序,测试(3)装入实际的初始数据在数据库正式投入运行之前,还要做好以下几项工作:(1)制定数据库重新组织的可行方案
(2)制定故障恢复规范(3)制定系统的安全规范7
运行和维护数据库正式投入运行后,运行维护阶段的主要工作是:(1)维护数据库的安全性与完整性
按照制定的安全规范和故障恢复规范,在系统的安全出现问题时,及时调整授权和更改密码
及时发现系统运行时出现的错误,迅速修改,确保系统正常运行
把数据库的备份和转储作为日常的工作,一旦发生故障,立即使用数据库的最新备份予以恢复
(2)监察系统的性能
运用DBMS提供的性能监察与分析工具,不断地监控着系统的运行情况
当数据库的存储空间或响应时间等性能下降时,立即进行分析研究找出原因,并及时采取措施改进
例如,可通修改某些参数、整理碎片、调整存储结构或重新组织数据库等方法,使数据库系统保持高效率地正常运作
(3)扩充系统的功能在维持原有系统功能和性能的基础上,适应环境和需求的变化,采纳用户的合理意见,对原有系统进行扩充,增加新的功能
数据库的作用:
1、实现数据共享:数据共享包含所有用户可同时存取数据库中的数据,也包括用户可以用各种方式通过接口使用数据库,并提供数据共享。
2、减少数据的冗余度:同文件系统相比,由于数据库实现了数据共享,从而避免了用户各自建立应用文件。减少了大量重复数据,减少了数据冗余,维护了数据的一致性。
3、保持数据的独立性:数据的独立性包括逻辑独立性(数据库中数据库的逻辑结构和应用程序相互独立)和物理独立性(数据物理结构的变化不影响数据的逻辑结构)。
4、数据实现集中控制:文件管理方式中,数据处于一种分散的状态,不同的用户或同一用户在不同处理中其文件之间毫无关系。利用数据库可对数据进行集中控制和管理,并通过数据模型表示各种数据的组织以及数据间的联系。
5、数据一致性和可维护性,以确保数据的安全性和可靠性:主要包括:安全性控制、完整性控制、并发控制,使在同一时间周期内,允许对数据实现多路存取,又能防止用户之间的不正常交互作用。
6、故障恢复:由数据库管理系统提供一套方法,可及时发现故障和修复故障,从而防止数据被破坏。数据库系统能尽快恢复数据库系统运行时出现的故障,可能是物理上或是逻辑上的错误。比如对系统的误 *** 作造成的数据错误等。
扩展资料
数据库技术的应用及特点
数据库最初是在大公司或大机构中用作大规模事务处理的基础。后来随着个人计算机的普及,数据库技术被移植到PC机(Personal Computer,个人计算机)上,供单用户个人数据库应用。接着,由于PC机在工作组内连成网,数据库技术就移植到工作组级。
现在,数据库正在Internet和内联网中广泛使用。20世纪60年代中期,数据库技术是用来解决文件处理系统问题的。当时的数据库处理技术还很脆弱,常常发生应用不能提交的情况。20世纪70年代关系模型的诞生为数据库专家提供了构造和处理数据库的标准方法,推动了关系数据库的发展和应用。
1979年,Ashton-Tate公司引入了微机产品dBase Ⅱ,并称之为关系数据库管理系统,从此数据库技术移植到了个人计算机上。20世纪80年代中期到后期,终端用户开始使用局域网技术将独立的计算机连接成网络,终端之间共享数据库,形成了一种新型的多用户数据处理,称为客户机/服务器数据库结构。
现在,数据库技术正在被用来同Internet技术相结合,以便在机构内联网、部门局域网甚至>
参考资料:
大学计算机专业数据库方向:
1、数据库应用开发(applicationdevelopment)
除了基本的SQL方面的知识,还要对开发流程,软件工程,各种框架和开发工具等等
数据库应用开发这个方向上的机会最多,职位最多。
2、数据建模专家(datamodeler)
除了基本的SQL方面的知识,非常熟悉数据库原理,数据建模负责将用户对数据的需求转化为数据库物理设计和物理设计,这个方向上在大公司(金融,保险,研究,软件开发商等)有专门职位,在中小公司则可能由程序员承担。
3、商业智能专家(business-BI)
主要从商业应用,最终用户的角度去从数据中获得有用的信息,涉及OLAP(onlineanalyticalprocessing),需要使用SSRS,cognos,crystalreport等报表工具,或者其他一些数据挖掘,统计方面的软件工具。
4、ETL开发(ETLDeveloper)
使用ETL工具或者自己编写程序在不同的数据源之间对数据进行导入,导出,转换,所接触的数据库一般数据量非常大,要求进行的数据转换也比较复杂和数据仓库和商业智能的关系比较密切。在一些数据库应用规模很大的公司里面有专门的职位,中小公司里面则可能由程序员或者DBA负责这方面的工作。
5、数据构架师(DataArchitect)
主要从全局上制定和控制关于数据库在逻辑这一层的大方向,也包括数据可用性,扩展性等长期性战略,协调数据库的应用开发,建模,DBA之间的工作。这个方向上在大公司(金融,保险,研究,软件开发商等)有专门职位,在中小公司或者没有这个职位,或者由开发人员,DBA负责。
6、数据库管理员(database-DBA)
数据库的安装,配置,调优,备份/恢复,监控,自动化等,协助应用开发(有些职位还要求优化SQL,写存储过程和函数等)。这个方向上的职位相对少一些,但一般有点规模的公司还是会有这样的职位
7、数据仓库专家(datawarehouse-DW)
应付超大规模的数据,历史数据的存储,管理和使用,和商业智能关系密切,很多时候BI和DW是放在一个大类里面的,但是我觉得DW更侧重于硬件和物理层上的管理和优化。
8、存储工程师(storageengineer)
专门负责提供数据存储方案,使用各种存储技术满足数据访问和存储需求,和DBA的工作关系比较密切。对高可用性有严格要求(比如通信,金融,数据中心等)的公司通常有这种职位,这种职位也非常少。
9、性能优化工程师(performanceengineer)
专长数据库的性能调试和优化,为用户提供解决性能瓶颈方面的问题。也有专门的性能优化工程师,负责为其数据库产品和关键应用提供这方面的技术支持。对数据库性能有严格要求的公司(比如金融行业)可能会有这种职位。因为针对性很强,甚至要求对多种数据库非常熟悉,所以职位极少。
10、高级数据库管理员(seniorDBA)
在DBA的基础上,还涉及上面3种职位的部分工作,具体包括下面这些:对应用系统的数据(布局,访问模式,增长模式,存储要求等)比较熟悉。对性能优化非常熟悉,可以发现并优化从SQL到硬件I/O,网络等各个层面上的瓶颈,对于存储技术相对熟悉,可能代替存储工程师的一些工作,对数据库的高可用性技术非常熟悉(比如MSSQL的集群,ORACLERAC/FailSafe,IBM的DPF,HADR等),对大规模数据库有效进行物理扩展(比如表分区)或者逻辑扩展(比如数据库分区,联合数据库等)。熟悉各种数据复制技术,比如单向,双向,点对点复制技术,以满足应用要求。灾难数据恢复过程的建立,测试和执行。这种职位一般只在对数据库要求非常高并且规模非常大(比如金融,电信,数据中心等)的公司需要,而且这种公司一般有一个专门独立负责数据库的部门或组。这种职位非常少。
数据库设计的基本步骤:
1、系统需求分析与设计。
2、概念结构分析与设计。
3、逻辑结构分析与设计。
4、物理结构分析与设计。
5、系统实施。
6、系统维护。
扩展资料:
数据库设计技巧:
1、原始文件与实体的关系
它可以是一对一,一对多,多对多的关系。一般来说,它们是一对一的关系:一个原始文档只对应于一个实体。在特殊情况下,它们可以是一对多或多对一关系,即一个原始文档对应于多个实体,或者多个原始文档对应于一个实体。
这里的实体可以理解为基本表。在对应关系明确后,对输入接口的设计非常有利。
2、主键和外键
一般来说,实体不能既没有主键也没有外键。在E-R图中,叶中的实体可以定义主键或不定义主键(因为它没有子代),但它必须有外键(因为它有父项)。
主键和外键的设计在全局数据库的设计中起着重要的作用。当全球数据库的设计完成后,一位美国数据库设计专家说:“钥匙无处不在,只有钥匙。”。这是他数据库设计的经验,也体现了他对信息系统核心(数据模型)高度抽象的理念。
因为:主键是一个高度抽象的实体。主键和外键的配对表示实体之间的连接。
3、基本表的属性
基本表不同于中间表和临时表,因为它具有以下四个特点:
原子性。基本表中的字段不可分解。
原始主义。基本表中的记录是原始数据(基本数据)的记录。
演绎的。所有输出数据都可以从基本表和代码表中的数据导出。
稳定。基本表的结构比较稳定,表中的记录要长期保存。
在了解基本表的性质之后,在设计数据库时,可以将基本表与中间表和临时表区分开来。
来源:百度百科-数据库设计
因此NCBI 的分类学数据库不是一个系统发育或分类学的“专家数据库”(Wheeler et al, 2000)。获取序列所对应的分类学信息有两种方法。一种方法,从NCBI 网站下载gi与taxid 对应表,在Taxonomy 数据库的FTP 地址下载。这个目录下有多个压缩文件,其中针对Windows *** 作系统的两个针对蛋白质序列和核苷酸序列的压缩文件分别是gi_taxid_protdmpgz 和gi_taxid_nucldmpgz 文件。这两个文件都只有两列,左边为gi 号,右边为Taxid。由于这些文件非常大,因此用浏览器来打开这些文件几乎是不可能的。随着时间的推移,这两个文件会越来越大,不过速度不会是指数增长的,并且在美国东部时间的每个星期一2:00 am NCBI 会对其进行更新。对于Windows 用户还有一个文件称为taxdumpzip 文件。文件解压缩后包括1 个prt 文件和6 个dmp 文件。Gencodedmp 文件保存有不同的密码子表,与同目录的gcprt 联合使用;mergeddmp 是保存有合并的taxid 号的对应表;nodesdmp 是结点信息;divisiondmp 是较大的几个分类;namesdmp 结点名称信息,每个id 对应多行。这些数据被Phylogenie 软件包中的blammer 程序用于构建进化树。利用ftp 地址的连接利用>
1、 ORACLE数据库专家认证
Oracle 9i DBA OCP认证是Oracle认证体系的核心部分,被誉为“Oracle认证的皇冠”。因此,Oracle 9i DBA OCP是代表数据库管理领域最高水平的资质证书,在全球业界具有极高的权威性和广泛的认可度。目前,大部分跨国公司都采用了ORACLE数据库系统,所以对这方面人才的需求非常大,而如今真正熟悉ORACLE 数据库的人较少,拿到专业证书的就更少。所以,获得这个认证对IT人士的职业发展大有帮助,目前,在所有的IT认证专家中,ORACLE的OCP的平均收入是最高的。
2、ORACLE数据库开发专家认证
Oracle 9i DEV OCP,是ORACLE数据库开发领域高级别的认证,持证者被公认为能熟练使用Developer/2000的工具建立各种O鄄RACLE Forms应用程序,和建立各种标准及自定义的报表。和DBA OCP一样,熟悉ORACLE开发工具的人少之又少,而市场需求非常之大,所以,持证者的职业前景看好,薪酬待遇也会高人一等。
3、 微软数据库管理员认证
持有MCDBA证书者被公认为对WINDOWS系统和SQL SERV鄄ER数据库非常熟悉,现在大部分中小企业都采用SQL SERVER数据库,因此对这方面人才的需求较大。但是,由于该证书属于入门级证书,考试难度不大,持证者人数较多,该证书的含金量已不如两三年前。
4、DB2解决方案专家认证
IBM的DB2软件是通用型数据库管理工具,通过这个认证,可让持证者在不同的 *** 作系统中自如完成数据库管理任务,从而成为真正的数据库技术专才。同时,由于IBM的数据库在金融、航空、电信、政府等大型机构中的普遍使用,持证者还可在这些领域发展。
5、 Sybase Adaptive服务器专家认证
Sybase公司的数据库系统软件以高度保密性和准确性为特色,很受对数据安全要求较高的企业的青睐,国内金融业、航空业、电信业企业和机构及政府部门,对相关专业人才的需求较大。获得该证书,被公认为具有一流的数据保护与纠错能力,在以上领域就业时,将被另眼相待。
以上就是关于数据库的发展过程全部的内容,包括:数据库的发展过程、数据库设计分为哪几个步骤、数据库有哪些作用等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)