教你设计大型Oracle数据库_工具

本文教你如何设计大型Oracle数据库希望对大家有所帮助

一概论

超大型系统的特点为

处理的用户数一般都超过百万有的还超过千万 数据库的数据量一般超过 TB;

系统必须提供实时响应功能系统需不停机运行要求系统有很高的可用性及可扩展性

为了能达到以上要求除了需要性能优越的计算机和海量存储设备外还需要先进的数据库结构设计和优化的应用系统

一般的超大型系统采用双机或多机集群系统下面以数据库采用Oracle 并行服务器为例来谈谈超大型数据库设计方法

确定系统的ORACLE并行服务器应用划分策略

数据库物理结构的设计

系统硬盘的划分及分配

备份及恢复策略的考虑

二 Oracle并行服务器应用划分策略

Oracle并行服务器允许不同节点上的多个INSTANCE实例同时访问一个数据库以提高系统的可用性可扩展性及性能 Oracle并行服务器中的每个INSTANCE实例都可将共享数据库中的表或索引的数据块读入本地的缓冲区中这就意味着一个数据块可存在于多个INSTANCE实例的SGA区中那么保持这些缓冲区的数据的一致性就很重要 Oracle使用 PCM( Parallel Cache Management)锁维护缓冲区的一致性 Oracle同时通过I DLM(集成的分布式锁管理器)实现PCM 锁并通过专门的LCK进程实现INSTANCE实例间的数据一致

考虑这种情况 INSTANCE 对BLOCK X块修改这时INSTANCE 对BLOCK X块也需要修改 Oracle并行服务器利用PCM锁机制使BLOCK X从INSTANCE 的SGA区写入数据库数据文件中又从数据文件中把BLOCK X块读入INSTANCE 的SGA区中发生这种情况即为一个PING PING使原来个MEMORY IO可以完成的工作变成个DISK IO和个 MEMORY IO才能够完成如果系统中有过多的PING 将大大降低系统的性能

Oracle并行服务器中的每个PCM锁可管理多个数据块 PCM锁管理的数据块的个数与分配给一个数据文件的PCM锁的个数及该数据文件的大小有关当INSTANCE 和INSTANCE 要 *** 作不同的BLOCK 如果这些BLOCK 是由同一个PCM锁管理的仍然会发生PING 这些PING称为FALSE PING 当多个INSTANCE访问相同的BLOCK而产生的PING是TRUE PING

合理的应用划分使不同的应用访问不同的数据可避免或减少TRUE PING;通过给FALSE PING较多的数据文件分配更多的PCM锁可减少 FALSE PING的次数增加PCM锁不能减少TRUE PING

所以 Oracle并行服务器设计的目的是使系统交易处理合理的分布在INSTANCE实例间以最小化PING 同时合理的分配PCM锁减少FALSE PING 设计的关键是找出可能产生的冲突从而决定应用划分的策略应用划分有如下四种方法

根据功能模块划分不同的节点运行不同的应用

根据用户划分不同类型的用户运行在不同的节点上

根据数据划分不同的节点访问不同的数据或索引

根据时间划分不同的应用在不同的时间段运行

应用划分的两个重要原则是使PING最小化及使各节点的负载大致均衡

三数据库物理结构的设计

数据库物理结构设计包括确定表及索引的物理存储参数确定及分配数据库表空间确定初始的回滚段临时表空间 redo log files等并确定主要的初始化参数物理设计的目的是提高系统的性能整个物理设计的参数可以根据实际运行情况作调整

表及索引数据量估算及物理存储参数的设置

lishixinzhi/Article/program/Oracle/201311/18944

自增长primary key

采用自增长primary key主要是性能早期的数据库系统经常采用某种编号比如身份z号码公司编号等等作为数据库表的primary key 然而很快大家就发现其中的不利之处

比如早期的医院管理系统用身份z号码作为病人表的primary key 然而第一不是每个人都有身份z;第二对于国外来的病人不同国家的病人的证件号码并不见得没有重复因此用身份z号码作为病人表的primary key是一个非常糟糕的设计考虑到没有医生或者护士会刻意去记这些号码使用自增长primary key是更好的设计

公司编号采用某种特定的编码方法这也是早期的数据库系统常见的做法它的缺点也显而易见很容易出现像千年虫的软件问题因为当初设计数据库表的时候设计的位数太短导致系统使用几年后不能满足要求只有修改程序才能继续使用问题在于任何人设计系统的时候在预计某某编号多少位可以够用的时候都存在预计不准的风险而采用自增长primary key 则不存在这种问题同样的道理没有人可以去记这些号码

使用自增长primary key另外一个原因是性能问题略有编程常识的人都知道数字大小比较比字符串大小比较要快得多使用自增长primary key可以大大地提高数据查找速度

避免用复合主键 (pound primary key)

这主要还是因为性能问题数据检索是要用到大量的 primary key 值比较只比较一个字段比比较多个字段快很多使用单个primary key 从编程的角度也很有好处 sql 语句中 where 条件可以写更少的代码这意味着出错的机会大大减少

双主键

双主键是指数据库表有两个字段这两个字段独立成为主键但又同时存在数据库系统的双主键最早用在用户管理模块最早的来源可能是参照 *** 作系统的用户管理模块

*** 作系统的用户管理有两个独立的主键 *** 作系统自己自动生成的随机 ID (Linux windows 的 SID) login id 这两个 ID 都必须是唯一的不同的是删除用户 test 然后增加一个用户 test SID 不同 login id 相同采用双主键主要目的是为了防止删除后增加同样的 login id 造成的混乱比如销售经理 hellen 本机共享文件给总经理 peter 一年后总经理离开公司进来一个普通员工 peter 两个peter 用同样的 login id 如果只用 login id 作 *** 作系统的用户管理主键则存在漏洞普通员工 peter 可以访问原来只有总经理才能看的文件 *** 作系统自己自动生成的随机 ID 一般情况下面用户是看不到的

双主键现在已经广泛用在各种数据库系统中不限于用户管理系统

以固定的数据库表应付变化的客户需求

这主要基于以下几个因素的考虑

大型EPR系统的正常使用维护需要软件厂商及其众多的合作伙伴共同给客户提供技术服务包括大量的二次开发

如果用户在软件正常使用过程中需要增加新的表或者数据库将给软件厂商及其众多的合作伙伴带来难题

软件升级的需要

没有一个软件能够让客户使用几十上百年不用升级的软件升级往往涉及数据库表结构的改变软件厂商会做额外的程序将早期版本软件的数据库数据升级到新的版本但是对于用户使用过程中生成的表进行处理就比较为难

软件开发的需要

使用固定的数据库库表从开发二次开发来说更加容易对于用户使用过程中生成的表每次查找数据时都要先查表名再找数据比较麻烦

举例来说早期的用友财务软件用Access作数据库每年建立一个新的数据库很快用户和用友公司都发现跨年度数据分析很难做因此这是一个不好的设计在 ERP 中很少有不同的年度数据单独分开一般来说所有年份的数据都在同一个表中对于跨国公司甚至整个集团公司都用同一个 ERP 系统的时候所有公司的数据都在一起这样的好处是数据分析比较容易做

现在大多数数据库系统都能做到在常数时间内返回一定量的数据比如 Oracle 数据库中根据 primary key 在万条数据中取条数据与在亿条数据中取条数据时间相差并不多

避免一次取数据库大量数据取大量数据一定要用分页

这基本上是现在很多数据库系统设计的基本守则 ERP 系统中超过万条数据的表很多对于很多表中的任何一个一次取所有的会导致数据库服务器长时间处于停滞状态并且影响其它在线用户的系统响应速度

一般来说日常 *** 作在分页显示的情况下面每次取得数据在之间系统响应速度足够快客户端基本没有特别长的停顿这是比较理想的设计这也是大型数据库系统往往用 ODBC ADO 等等通用的数据库联接组件而不用特定的速度较快的专用数据库联接组件的原因因为系统瓶颈在于数据库( Database) 方面(数据量大) 而不在于客户端(客户端每次只取少量数据)

在 B/S 数据库系统中分页非常普遍早期的数据库系统经常有客户端程序中一次性取大量数据做缓冲现在已经不是特别需要了主要原因有

数据库本身的缓冲技术大大提高

大部分数据库都会自动将常用的数据自动放在内存中缓冲以提高性能

数据库联接组件的缓冲技术也在提高

包括 ADO 在内的一些数据库联接组件都会自动对数据结果集(result set)进行缓冲并且效果不错比较新颖的数据库联接组件比如 Hibernate 也加入了一些数据结果集缓冲功能

当然也有一些数据库联接组件没有对数据结果集进行缓冲比如 JDBC Driver 不过几年之内情况应该有所改观也有些不太成功的数据缓冲比如 EJB 中的实体Bean 性能就不尽如人意实体Bean数据也是放在内存中可能是因为占用内存过多的缘故

lishixinzhi/Article/program/SQL/201311/16157

数据库的六个设计过程

1、系统需求分析阶段：分析用户的需求，包括数据、功能和性能需求

2、概念结构设计：主要采用E-R模型进行设计，包括画E-R图

3、逻辑结构设计：通过将E-R图转换成表，实现从E-R模型到关系模型的转换，进行关系规范化

4、数据库物理设计：主要是为所设计的数据库选择合适的存储结构和存储路径；

5、数据库的实施：包括编程、测试和试运行

6、数据库运行和维护：系统的运行和数据库的日常维护

扩展资料：

数据库是“按照数据结构来组织、存储和管理数据的仓库”。是一个长期存储在计算机内的、有组织的、可共享的、统一管理的大量数据的集合。

数据库是以一定方式储存在一起、能与多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合，可视为电子化的文件柜——存储电子文件的处所，用户可以对文件中的数据进行新增、查询、更新、删除等 *** 作。

以上就是关于教你设计大型Oracle数据库全部的内容，包括:教你设计大型Oracle数据库、数据库进阶：ERP管理软件数据库系统的几种设计方法、数据库的六个设计过程等相关内容解答，如果想了解更多相关内容，可以关注我们，你们的支持是我们更新的动力！

欢迎分享，转载请注明来源：内存溢出

原文地址:https://54852.com/sjk/9533159.html

教你设计大型Oracle数据库

发表评论

评论列表（0条）