1、数据仓库的逻辑结构
��数据仓库的逻辑结构如图13-2-9所示:
|
图13-2-9:数据仓库的逻辑结构示意图
|
图13-2-9说明了数据仓库从传统数据库或其他数据源获得原始数据,先按辅助决策的主题要求形成当前基本数据层,再按综合决策的要求形成综合数据层(又分为轻度综合层和高度综合层)。随着时间的推移,由时间控制机制将当前基本数据层转为历史数据层。
��元数据是关于数据的数据(可以理解为数据仓库的数据字典),它是数据仓库的核心。用于存储数据模型和定义数据结构、转换规则、仓库结构、控制信息等。在数据仓库的逻辑结构中起着十分重要的作用,可以说如果没有元数据,就没有数据仓库的一切!
|
图13-2-10:数据仓库的元数据
|
如图13-2-10所示,元数据在数据仓库中贯穿着一切。
2、数据仓库的物理结构
��由于有OLAP的要求,数据仓库中数据的物理存储形式应该是基于多维数据模型(所以在逻辑上数据仓库就是一个多维数组),在实现中一般有两种途径:
��⑴�基于多维数据库的空间超立方体,又称数据立方体(DATA CUBE);
��⑵�基于关系数据库的星型模式(由关系型的事实表和维表组成);
|
图13-2-11:数据仓库的物理结构之一示意图
|
利用目前成熟的关系数据库系统,同样也可以建立数据仓库。这样做成本低,实现快,但数据仓库的效率远不如多维数据库形式。在这种情况下,主要是利用星型模式(STAR
SCHEME)来组织数据。
|
图13-2-12:数据仓库的物理结构之二示意图
|
图13-2-13:数据仓库系统的体系结构
|
��⑴�源数据:数据仓库的数据来源于多个数据源,包括企业内部数据、市场调查报告、政府统计部门提供的统计数据及各种文档之类的外部数据。
��⑵�仓库管理:在确定数据仓库的信息需求后,首先进行数据建模,然后确定从源数据到数据仓库的数据抽取、清洗和转化过程,最后划分维数及确定数据仓库的物理存储结构。
��⑶�数据仓库:包括对数据的安全、归档、备份、维护、恢复等工作的支持,这些工作需要利用数据库管理系统DBMS的功能。
��⑷�分析工具:用于完成实际决策问题所需的各种查询检索工具、多维数据的OLAP分析工具、数据挖掘DM工具等,以实现决策支持系统DSS的各种要求。 |