
1、首先你得搞清楚建设数仓的目的是什么
是偏向于整合各系统数据,为数据分析决策服务,还是偏向于快速的完成分析决策需求?
如果是前者,那么在数据仓库建模的时候一般会选择ER建模方法;
如果是后者,一般会选择维度建模方法。
ER建模:即实体关系建模,由数据仓库之父BIll Inmon提出,核心思想是从全企业的高度去设计三范式模型,用实体关系描述企业服务。主张的是自上而下的架构,将不同的OLTP数据集中到面向主题的数据仓库中。
维度建模:由Kimball提出,核心思想是从分析决策的需求出发构建模型。这种模型由事实表和维表组成,即星型模型和雪花模型。Kimball倡导自下而上的架构,可以针对独立部门建立数据集市,再递增的构建,汇总成数据仓库。
2、其次你得进行深入的业务调研和数据调研
业务调研:深入的业务调研能使你更加明确数仓建设的目的;同时也利于后续的建模设计,随着调研的开展,如何将实体业务抽象为数仓模型会更加明朗。
数据调研:各部门或各科室的数据现状了解,包括数据分类、数据存储方式、数据量、具体的数据内容等等。这对后续的主数据串联或者维度一致性处理等等都是必须的基础。
3、然后是数据仓库工具选型
传统型数据仓库:一般会选择第三方厂家的数据库和配套ETL工具。因为有第三方支持,相对有保障;但缺点也很明显,受约束以及成本较高。
NoSQL型数据仓库:一般是基于hadoop生态的数据仓库。hadoop生态已经非常强大,可以找到各种开源组件去支持数据仓库。缺点是需要招聘专门人士去摸索,并且相对会存在一些未知隐患。
4、最后是设计与实施
设计:包括数据架构中的数据层次划分以及具体的模型设计;也包括程序架构中的数据质量管理、元数据管理、调度管理等;
实施:规范化的项目管理实施,但同时也需记住一点,数据仓库不是一个项目,它是一个过程。
概念数据模型是按用户的观点对数据和信息建模,是现实世界到信息世界的第一层抽象,最常用的概念数据模型就是er图,也就是说他们是包含关系。
概念模型把现实世界的关系抽象到信息世界,er图的画法选择就是对数据库在进行设计,然后依据er图进行逻辑结构设计,物理结构设计,这些就是实现了从信息世界到计算机世界的抽象,即数据的结构、储存方式等等。最后是数据库的创建与维护。答得还行吧,把分给我呗
1、首先要了解ER图的核心要素:实体,属性,关系;实体就是一个个对象,属性就是实体所有的某个属性,关系就是实体和实体之间或者实体内部之间的关系;
2、其次要了解ER图中怎么表示描述的三个核心要素:在ER图中,矩形代表实体,椭圆代表属性,菱形代表关系,各个形状之间用线段连接;
3、首先打开visio,打开“新建”,“常规”,“基本框图”,新建一个空的界面;
4、在这张空的图里要表现的关系:对象1,对象2,关系,先来画对象1,添加一个矩形框,三个椭圆框;
5、用同样的方法,来建第二个对象课程,也是放一个矩形,三个椭圆形,写入对象的名称,然后用线把他们连接起来;
6、建这两个对象之间的关系,像图中加一个菱形,在菱形里写上关系的名称;
7、这样一个简单的ER图做好。
ER图是基于ER模型(实体关系模型)画的,属于概念模型,是对现实世界的实体及其之间关系的抽象。
数据库表是属于数据模型,用来描述数据的结构关系。
通常我们数据库的设计要经过下面这个过程:
现实世界-〉概念模型-〉数据模型
一般项目的设计中,首先通过需求分析的人员根据客户抽象出ER图,然后由数据库的设计人员根据ER图和用户对查询等方面的需求设计出数据库的表结构,以及相关的视图和索引。
max_allowed_packet = 64M
[mysql]
disable-auto-rehash #允许通过TAB键提示
default-character-set = utf8
connect-timeout = 3
实体-联系图(Entity-Relation Diagram)用来建立数据模型,在数据库系统概论中属于概念设计阶段,形成一个独立于机器,独立于DBMS的ER图模型。 通常将它简称为ER图,相应地可把用ER图描绘的数据模型称为ER模型。ER图提供了表示实体(即数据对象)、属性和联系的方法,用来描述现实世界的概念模型。 构成E-R图的基本要素是实体、属性和联系,其表示方法为: ˙实体型:用矩形表示,矩形框内写明实体名; ˙属性:用椭圆形或圆角矩形表示,并用无向边将其与相应的实体连接起来;多值属性由双线连接;主属性名称下加下划线; ˙联系:用菱形表示,菱形框内写明联系名,并用无向边分别与有关实体连接起来,同时在无向边旁标上联系的类型 在E-R图中要明确表明1对多关系,1对1关系和多对多关系。 ˙1对1关系在两个实体连线方向写1; ˙1对多关系在1的一方写1,多的一方写N; ˙多对多关系则是在两个实体连线方向各写N,M
以上就是关于1.企业经历过两次失败的数据仓库建设,现在是第三次,人们普遍认为这次也将会失败。项目经理应该作些什全部的内容,包括:1.企业经历过两次失败的数据仓库建设,现在是第三次,人们普遍认为这次也将会失败。项目经理应该作些什、ER图和概念数据模型的关系、数据库技术ER图如何画等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)