分布式数据库由一组数据集合组成,这些数据属于一个逻辑数据库,但数据存贮在多个物理计算机结点上,通过网络连接在一起。
分布式数据库系统是在集中式数据库系统的基础上发展起来的,是数据库技术与计算机网络技术结合的产物。分布式数据库系统是具有管理分布数据库功能的计算机系统。一个分布式数据库是由分布于计算机网络上的多个逻辑相关的数据库组成的集合,网络中的每个结点具有独立处理的能力(称为场地自治),可执行局部应用,同时,每个结点通过网络通讯系统也能执行全局应用。所谓局部应用即仅对本结点的数据库执行某些应用。所谓全局应用(或分布应用)是指对二个以上结点上的数据库执行某些应用。支持全局应用的系统才能称为分布式数据库系统。对用户来说,一个分布式数据库系统逻辑上看如同集中式数据库系统一样,用户可在任何一个场地执行全局应用。
分布式数据库系统适合于单位分散的部门,允许各个部门将其常用数据存储在本地,实施就地存放就地使用,降低通讯费用,并可提高响应速度。因为这些企业实际上已经把数据分散在不同的位置或不同的物理计算机上。例如,一个公司的不同部门的数据,银行系统的各个分行数据等。企业的信息资源已经是被划分为许多信息资源孤岛,分布式数据库系统是适应企业的结构现状,满足企业的应用要求,把所有的信息资源孤岛连接起来,实现数据的异地存取。
分布式数据库可将数据分布在多个结点上,增加适当的冗余,可提高系统的可靠性。由于分布式数据库系统结构的特点,它和集中式数据库系统相比具有可扩展性,为扩展系统的处理能力提供了较好的途径。
分布式数据库将数据分布在多个结点上反映企业的信息结构,实现起来是比较困难的。在20世纪80年代前后,出现了一些分布式数据库原型系统。分布式数据库系统是有应用前景的研究课题。但是,目前在企业中应用的分布式数据库系统,是在关系数据库管理系统中,通过增加访问远程服务器数据的组件,实现对远程服务器数据库数据的访问。这与真正的分布式数据库系统是有差别的。
分布式数据库系统的特点:
(1) 数据独立性:除了数据的逻辑独立性和物理独立性之外,还有数据分布的透明性。即用户不用关心数据的逻辑分布、物理分布,在用户的应用程序中,如同操作一个集中式数据库一样。
(2) 集中和结点自治相结合:每个局部结点都有一个完全的数据库系统,各个局部结点的DBMS可独立的管理局部数据库,同时又服从集中控制机制,支持全局的应用。就是说,所有结点的系统协同工作,从网络的任何一个结点上都可以访问存储在任何地方的数据,如同访问本机上的数据一样。
(3) 支持全局数据库的一致性和可恢复性:由于全局应用涉及到多个局部结点上的数据,有全局事务的提交和回滚。
(4) 位置透明性:用户和应用程序不必知道所使用的数据存储在什么地方。简化了应用程序的复杂性,即使存储数据的位置改变了,应用程序也不用改变。
(5) 复制透明性:在分布式系统中,为了提高系统的性能和可用性,可以把一个场地的数据复制到其他场地存放。应用程序执行时,如果使用复制到本地的数据,就可以在本地数据库基础上运行,避免通过网络传输数据,提高了系统的运行和查询效率。但是,对于有复制数据的更新操作,就要涉及到对所有复制数据库的更新。所谓复制透明性,是指用户不用关系数据库在网络中各个结点的复制情况,被复制数据的更新都由系统自动完成。
(6) 易于扩展性:在大多数网络环境中,单个数据库服务器最终会不够用。如果服务器软件能支持透明的水平扩展,那么可以增加多个服务器或处理器(多处理器计算机)来进一步分布数据和分担处理任务。
一个分布式数据库是由分布于计算机网络上的多个逻辑相关的数据库组成的集合,位置透明性和复制透明性使用户看到的数据库系统就像是一个集中式数据库系统一样。网络中的每个结点具有独立处理的能力(称为场地自治),可执行局部应用和二个以上结点的全局应用。支持全局应用的系统才能称为分布式数据库系统。
|