分布式数据库简介.ppt
介绍的内容:,分布式数据库的定义;分布式数据库的特点;分布式数据库的类型;分布式数据库发展的原因;分布式数据库的目标。,分布式数据库的定义:,分布式数据库是由一组数据组成的,这些数据物理上分布在计算机网络的不同结点(亦称为场地)上,逻辑上是属于同一个系统。,强调两点:一、分布性,数据库中的数据不是存储在同一场地.更 确切地讲,不存储在同一计算机的存储设备上.这就是与集中式数据库的区别;二、逻辑整体性,这些数据逻辑上是互相联系的,是一个整体(逻辑上如同集中数据库)【全局数据库(逻辑),局部数据库(物理)】,分布式数据库的特点:,分布式数据库系统是在集中式数据库系统成熟技术的基础上发展起来的,但不是简单地把集中式数据库分散地实现,它是具有自己的性质和特征的系统。集中式数据库系统的许多概念和技术,如数据独立性、数据共享和减少冗余度、并发控制、完整性、安全性和恢复等等在分布式数据库系统中都有了不同之处及更加丰富的内涵,分布式数据库的特点:,一、数据独立性,在分布式数据库中,数据独立性这一特性比集中式数据库更加重要,并具有更多的内容,除了数据的逻辑独立性与物理独立性外,还有数据分布独立性(分布透明性),分布透明性指用户不必关心数据的逻辑分区,不必关心数据物理位置分布的细节,也不必关心重复副本(冗余数据)的一致性问题,同时也不必关心局部场地上数据库支持哪种数据模型。,分布式数据库的特点:,二、集中与自治相结合的控制结构,数据库是用户共享的资源在分布式数据库中,数据的共享有两个层次:一是局部共享,即在局部数据库中存储局部场地上各用户的共享数据;二是全局共享,即在分布式数据库的各个场地也存储可供网中其它场地的用户共享的数据,支持系统中的全局应用因此,相应的控制结构也具有两个层次:集中和自治,分布式数据库的特点:,三、适当增加数据冗余度,在集中式数据库中,尽量减少冗余度是系统目标之一其原因是,冗余数据浪费存储空间,而且容易造成各副本之间的不一致性而在分布式数据库中却希望增加冗余数据,在不同的场地存储同一数据的多个副本,其原因是:1提高系统的可靠性、可用性,当某一场地出现故障时,系统可以对另一场地上的相同副本进行操作,不会因一处故障而造成整个系统的瘫痪。2提高系统性能系统可以根据距离选择离用户最近的数据副本进行操作,减少通信代价,改善整个系统的性能。,分布式数据库的特点:,四、全局的一致性、可串行性和可恢复性,分布式数据库中各局部数据库应满足集中式数据库的一致性、可串行性和可恢复性除此以外还应保证数据库的全局一致性、并行操作的可串行性和系统的全局可恢复性这是因为全局应用要涉及两个以上结点的数据因此在分布式数据库系统中一个业务可能由不同场地上的 多个操作组成,分布式数据库的类型:,1、分布式数据,但只有一个总数据库,没有局部数据库;2、分层式处理,每一层都有自己的数据库;3、充分分散的分布式网络,没有中央控制部分,各节点之间的联接方式又可以有多种,如松散的联接,紧密的联接,动态的联接,广播通知式联接等。,分布式数据库发展的原因:,1、它可以解决组织机构分散而数据需要相互联系的问题。比如银行系统,总行与各分行处于不同的城市或城市中的各个地区,在业务上它们需要处理各自的数据,也需要彼此之间的交换和处理,这就需要分布式的系统。,2、可以方便的扩充。如果一个组织机构需要增加新的相对自主的组织单位来扩充机构,则分布式数据库系统可以在对当前机构影响最小的情况下进行扩充。,分布式数据库发展的原因:,3、均衡负载的需要。数据的分解采用使局部应用达到最大,这使得各处理机之间的相互干扰降到最低。负载在各处理机之间分担,可以避免临界瓶颈。,4、方便进行全局应用。当现有机构中已存在几个数据库系统,而且实现全局应用的必要性增加时,就可以由这些数据库自下而上构成分布式数据库系统。,5、系统的可靠性高。相等规模的分布式数据库系统在出现故障的几率上不会比集中式数据库系统低,但由于其故障的影响仅限于局部数据应用,因此就整个系统来讲它的可靠性是比较高的。,分布式数据库的目标:,1适应部门分布的组织结构,降低费用。使用数据库的单位在组织上常常是分布的(如分为部门、科室、车间等等),在地理上也分布的分布式数据库系统的结构符合部门分布的组织结构,允许各个部门对自己常用数据存储在本地,在本地录入、查询、维护,实行局部控制由于计算机资源靠近用户,因而可以降低通信代价,提高响应速度,使这些部门使用数据库更方便更经济。,分布式数据库的目标:,2提高系统的可靠性和可用性.改善系统的可靠性和可用性是分布式数据库的主要目标将数据分布于多个场地,并增加适当的冗余度可以提供更好的可靠性一些可靠性要求较高的系统,这一点尤其重要因为一个地出了故障不会引起整个系统崩溃因为故障场地的用户可以通过其它场地进入系统而其它场地的用户可以由系统自动选择存取路径,避开故障场地,利用其它数据副本执行操作,不影响业务的正常运行,分布式数据库的目标:,3充分利用数据库资源,提高现有集中式数据库的利用率。当在一个大企业或大部门中已建成了若干个数据库之后,为了利用相互的资源,为了开发全局应用,就要研制分布式数据库系统这种情况可称为自底向上的建立分布式系统这种方法虽然也要对各现存的局部数据库系统做某些改动、重构,但比起把这些数据库集中起来重建一个集中式数据库,则无论从经济上还是从组织上考虑,分布式数据库均是较好的选择,分布式数据库的目标:,4逐步扩展处理能力和系统规模。当一个单位规模扩大要增加新的部门(如银行系统增加新的分行,工厂增加新的科室、车间)时,分布式数据库系统的结构为扩展系统的处理能力提供了较好的途径:在分布式数据库系统中增加一个新的结点这样做比在集中式系统中扩大系统规模要方便、灵活、经济得多,