图13-5-1:DSS的解决方案示意图
数据仓库、OLAP和数据挖掘是作为三种独立的信息处理技术出现的。数据仓库用于数据的存储和组织,OLAP集中于数据的分析,数据挖掘则致力于知识的自动发现。它们都可以分别应用到信息系统的设计和实现中,以提高相应部分的处理能力。但是,由于这三种技术内在的联系性和互补性,将它们结合起来即是一种新的DSS构架。这一构架以数据库中的大量数据为基础,其特点是:
��⑴�在底层的数据库中保存了大量的事务级细节数据。这些数据是整个DSS系统的数据来源。
��⑵�数据仓库对底层数据库中的事务级数据进行集成、转化和综合,重新组织成面向全局的数据视图,为DSS提供数据存储和组织的基础。
��⑶�OLAP从数据仓库中的集成数据出发,构建面向分析的多维数据模型,再使用多维分析方法从多个不同的视角对多维数据进行分析、比较,分析活动从以前的方法驱动转向了数据驱动,分析方法和数据结构实现了分离。
��⑷�数据挖掘以数据仓库和多维数据库中的大量数据为基础,自动地发现数据中的潜在模式,并以这些模式为基础自动地作出预测。数据挖掘表明知识就隐藏在日常积累下来的大量数据之中,仅靠复杂的算法和推理并不能发现知识,数据才是知识的真正源泉。数据挖掘为人工智能(AI)技术指出了一条新的发展道路。
��
��虽然我们给出的基于数据库的决策支持系统的解决方案在理论上是可行的,但是在实际的实现过程中还是有很多问题的。从目前工业界的产品来看,OLAP与数据仓库的结合还是很完美的,而数据挖掘DM和OLAM的方法与数据库或数据仓库的结合还很不完善,主要原因就是一个很好的数据挖掘算法的输入数据都是放在自定义数据结构的文件里,而如果要直接以原始的数据库或数据仓库作为数据挖掘的数据输入则还需要做很多的转换工作,才能满足数据挖掘算法的要求。因此,怎样使源数据、数据仓库和数据挖掘之间无缝集成成为最近的一个研究热点。
��