高级数据库技术第7章移动数据库.ppt
《高级数据库技术第7章移动数据库.ppt》由会员分享,可在线阅读,更多相关《高级数据库技术第7章移动数据库.ppt(111页珍藏版)》请在课桌文档上搜索。
1、第7章 移动数据库7.1 移动数据库简介,7.1.1 移动数据库与移动计算,移动计算的概念是对“任何时间、任何地点的立即通讯”的扩展。在分布式计算的基础上,计算环境进一步扩展为包含各种移动设备、具有无线通信能力的服务网络,构成了一个新的计算环境,即移动计算环境,嵌入式移动数据库系统是支持移动计算或某种特定计算模式的数据库管理系统,数据库系统与操作系统、具体应用集成在一起,运行在各种智能型嵌入设备或移动设备上。其中,嵌入在移动设备上的数据库系统由于涉及数据库技术、分布式计算技术,以及移动通讯技术等多个学科领域,目前已经成为一个十分活跃的研究和应用领域嵌入式移动数据库或简称为移动数据库(EMDBS
2、)。,移动计算是建立在移动环境上一种新型的计算技术,它使得计算机或其他信息设备在没有与固定的物理连接设备相连的情况下能够传输数据。移动计算的作用在于,将有用、准确、及时的信息与中央信息系统相互作用,分担中央信息系统的计算压力,使有用、准确、及时的信息能提供给在任何时间、任何地点需要它的用户。移动计算环境由于存在计算平台的移动性、连接的频繁断接性、网络条件的多样性、网络通讯的非对称性、系统的高伸缩性和低可靠性以及电源能力的有限性等因素,它将比传统的计算环境更为复杂和灵活。这使得传统的分布式数据库技术不能有效支持移动计算环境,因此嵌入式移动数据库技术(Mobile Database)由此而产生,它
3、涉及传统的数据库技术,分布式计算技术,以及移动通讯技术等多个学科领域。,7.1.2 移动数据库的特点,(1)移动性及位置相关性:移动数据库可以在无线通讯单元内及单元间自由移动,而且在移动的同时仍然可能保持通讯连接;此外,应用程序及数据查询可能是位置相关的。这要求移动数据库系统支持这种移动性,解决过区切换问题,并实现位置相关的处理。(2)频繁的断接性:移动数据库与固定网络之间经常处于主动或被动的断接状态,这要求移动数据库系统中的事务在断接情况下仍能继续运行,或者自动进入休眠状态,而不会因网络断接而撤消。,(3)网络条件的多样性:在整个移动计算空间中,不同的时间和地点连网条件相差十分悬殊。因此,移
4、动数据库系统应该提供充分的灵活性和适应性,提供多种系统运行方式和资源优化方式,以适应网络条件的变化。(4)系统规模庞大:在移动计算环境下,用户规模比常规网络环境庞大得多,采用普通的处理方法将导致移动数据库系统的效率极为低下。,(5)系统的安全性及可靠性较差:由于移动计算平台可以远程访问系统资源,从而带来新的不安全因素。此外,移动主机遗失、失窃等现象也容易发生,因此移动数据库系统应该提供比普通数据库系统更强的安全机制。(6)资源的有限性:移动设备的电源通常只能维持几个小时;此外,移动设备还受通讯带宽、存储容量、处理能力的限制。移动数据库系统必须充分考虑这些限制,在查询优化、事务处理、存储管理等诸
5、环节提高资源的利用效率。,(7)网络通讯的非对称性。上行链路的通讯代价与下行链路有很大的差异。这要求在移动数据库的实现中充分考虑这种差异,采用合适的方式(如数据广播)传递数据。此外,如果系统所嵌入的某种移动设备支持实时应用,则嵌入式数据库系统还要考虑实时处理的要求。这是因为设备的移动性,如果应用请求的处理时间过长,任务就可能在执行完成后得到无效的逻辑结果,或有效性大大降低。因此,处理的及时性和正确性同等重要。,7.1.3 移动数据库的典型系统模型,图1 移动数据库的典型系统模型,动数据库系统由三类结点组成,即:(1)服务器(SVR):一般为固定结点,每个服务器维护一个本地数据库,服务器之间由可
6、靠的高速互联网络连接在一起,构成一个传统意义上的分布式数据库系统.服务器可以处理客户的联机请求,并可以保持所有请求的历史记录。,(2)移动支持结点(简称MSS):MSS也位于高速网络中,并具有无线联网能力,它们用于支持一个无线网络单元(cell),该单元内的移动客户机既可以通过无线链路与一个通信,从而与整个固定网络连通,也可以接收由发送的广播信息。服务器与可以是同一台机器。(3)移动客户机(简称):的处理能力与存储能力相对于服务器来说非常有限,且具有移动性(即可以出现在任意一个无线单元中),经常与服务器断接(指无法与服务器联机通信)。即使在与服务器保持连接时,由于所处的网络环境多变,与服务器之
7、间的网络带宽相差很大,且可靠性较低、网络延迟较大。,7.2 移动数据库的关键技术,在移动数据库的关键技术的研究中,比较重要的有复制与缓存技术、数据广播、移动查询技术、移动事务处理技术等,7.2.1 移动数据库的复制与缓存技术,移动数据库的复制技术包括两部分:首先是服务器节点间的数据复制,简称为复制;另外还包括移动节点与服务器节点之间的复制,这常被称为缓存。复制技术首要考虑的问题是维护多个复制节点上数据的一致性。现有的复制协议可分为严格一致性协议和弱一致性协议两类:严格一致性协议要求在任何时刻所有数据库的复制都是一致的;而弱一致性协议允许各个复制之间存在暂时的不一致,但这种不一致总是保持在一定的
8、界限内,而且总是能够趋向于一致,严格一致性协议是数据库系统追求的目标,但是在移动数据库系统中它却并不合适,因为严格一致性协议需要所有节点都处于连接状态,以完成所有副本的更新,而移动计算环境中移动节点却有频繁断接的特点。另外,即使是在保持连接的服务器节点间采用严格一致性协议,其可用性也很差,因此只要允许,服务器节点间的复制更新也常采用弱一致性协议。,移动计算环境下复制技术需要考虑的主要问题有三个(1)考虑移动节点与服务器节点间如何合理分配数据的问题。即要考虑如何提高移动节点缓存数据的命中率问题。,(2)考虑移动节点与服务器节点数据的同步问题。移动节点在网内时,在可以保持两者数据同步的情况下应尽量
9、减少两者的通信时间与通信量,以节省通信费用。在移动节点断接后重新入网时,节点在断接期间对本地缓存所做的操作可能与服务器对数据的操作产生冲突,这时候采取什么冲突策略是移动复制缓存技术需要考虑的最重要的问题。(3)考虑如何改良服务器节点间的复制策略以使其更高效、更好地支持移动性。,1两级复制体系结构两级复制体系是J.Gray在90年代初提出的,它以主副本更新复制协议为基础。主副本更新方式在分布式数据库中十分常用,其主要思想是在数据对象的多个副本中指定一个主副本,从而更新事务只要更新了主副本的值便认为是逻辑完成了,由主副本所在的场地更新其他副本的值。,针对移动数据库系统的结构特点,该体系把节点分成两
10、类:一类称为基节点,它们联接在高速固定网络中,在基节点间存在一个复制策略,称为第一级复制;另一类是移动节点,他们经常处于断接状态,它们也存有与基节点之间的复制缓存,称为第二级复制。数据对象的主副本大部分位于基节点中,但也可位于移动节点中。,由于移动节点可能处于断接状态,事务有可能不能及时更新数据对象的主副本的值,因此把事务分成两类:(1)基事务:它在对象的主副本上执行,更新对象的主副本值。(2)暂态事务:它主要产生于移动节点中,即在断接期间对本地缓存的数据进行操作的事务,它保证移动节点在断接期间仍能尽可能的继续工作。暂态事务在移动节点重新联机时,将会产生一个基事务,以真正更新数据对象主副本的值
11、,保持系统数据的一致性。,由于存在暂态事务,移动节点上的每个复制对象都维护两个值:(1)主版本:指从数据对象的主副本得到的最新值。(2)暂态版本:在断接期间由本地暂态事务对缓存的数据对象进行操作产生的新值。在断接期间该新值对移动节点本身是可见的,即断接期间移动节点看到的数据对象的值为该暂态版本。暂态事务必须遵循一条准则:它们只能访问主节点是基节点或移动节点本身的数据对象。,两级复制体系的同步处理策略是这样的:当移动节点处于联机状态时,它类似于主副本更新协议。移动节点使用复制对象的主版本值,并适时更新其值,保持与基节点数据的一致性,为断接状态做好准备。当移动节点处于断接状态时,移动节点使用其数据
12、库复制继续工作,生成若干暂态事务,并把这些事务对数据对象的更新保存到数据的暂态版本中。此时移动节点可见的数据是复制对象的暂态版本。,当移动节点由断接状态重新入网后,对于移动节点,它需要做以下工作:(1)它需要把断接期间对主副本在本移动节点的数据对象的更新值传给基节点,再在基节点间传播此更新。,(2)它需要接收主副本在基节点的数据对象的更新值,使其复制对象的主版本重新与基节点数据保持一致。移动节点可见的数据重新变为主版本,暂态版本将被丢弃。(3)在基节点上重做暂态事务。它向基节点提交所有暂态事务及其输入参数,由基节点生成并执行对应的基事务。并等待基事务的处理结果,与基节点相配合完成对应的基事务。
13、,,对于基节点,它发现一个移动节点重新联机时,需要做以下工作:(1)将主副本在基节点上的数据对象的更新值发给移动节点,以同步移动节点复制对象主版本的值。,(2)接收移动节点发送的主副本在该移动节点的数据的更新值,并采用一定的策略把此更新值传播到其他基节点中。(3)接收移动节点的暂态事务序列及其参数,生成相应的基事务并执行。该基事务执行得到的结果很可能与原来在移动节点执行的暂态事务得到的结果不同。此时,根据需要,我们或者可以通知移动节点该事务失败,并同时夭折所有基于该事务结果的事务;也可以简单的把基事务得到的新结果传回给移动节点,并执行后续事务。,综上所述,两级复制体系既支持移动节点在断接情况下
14、继续进行数据的读写,提高了系统的可用性,又能在重新入网时采取适当的同步策略保证系统数据的一致性,因此十分适合移动计算环境。但它也有一些缺陷,如暂态事务在基站中重做需要很大的开销等。,2三级复制体系结构三级复制体系结构是由我国学者提出的。从1996年开始,长沙国防科技大学成立有关研究小组对移动数据库进行研究,提出了一种移动数据库的三级复制体系结构,简称TTR(Three-Tier Replication Architecture),它是国内移动数据库复制技术中最有代表性的研究。三级复制体系结构包括服务器级复制,空中复制和客户机缓存这三级复制机制,,(1)服务器级复制服务器级复制是指连接在固定高速
15、网络中的服务器节点间的复制策略。理论上这里可以采取传统的分布式数据库中所用到的协议,但是为了更好的支持移动计算环境,通常会采用比传统协议更弱的弱一致性复制协议。在TTR中设计了一种弱一致性复制协议,简称WCSR(Weakly Consistent Server Replication),它弱于前面提到的主副本更新复制协议。WCSR协议最大的优点是具有较短的响应时间,在该协议下,每个复制服务器都支持查询与更新操作,用户提交事务时,只要访问一个服务器就可以了:服务器在接到用户的查询事务时,直接返回用户本地复制的数据;而在接到用户的更新事务时,将该事务记入暂时事务日志后,也是直接对本地复制进行操作,
16、然后马上返回结果给用户。,以上WCSR协议的操作方式将允许复制服务器间存在暂时的不一致性,因此它采用一种周期成对同步的复制更新方式来收敛这种不一致性。它的主要思想是:每个服务器周期地选择另一个服务器来交换各自的暂态事务日志,同步双方的数据库状态,经过有限次的成对同步后,所有复制服务器间的数据库状态便达到一致了。在两个服务器同步时,为了维护不同服务器上并发更新事务的一致性,采用了基于时间戳的并发控制方法,并采用了一种基于应用语义的冲突检测与消解技术,避免不必要的事务冲突。WCSR实际上也是一种可变一致性的复制机制,它通过对强事务的支持来满足用户对高一致性的要求。当用户需要取得高一致性而愿意牺牲性
17、能和响应时间时,可以发出强事务的请求,从而取得与传统严格一致性复制协议相似的执行效果。,(2)空中复制空中复制,即数据广播,指的是服务器利用无线网络固有的广播能力,将服务器数据库中经常被用户访问的热点数据组织起来,经由无线信道向移动用户广播。易知这是一种只读的数据复制方式,即移动节点单方面对广播数据进行读取。,无线网络具有非对称性的特点,从服务器到移动节点的通信带宽要远高于移动节点到服务器节点的带宽,同时移动数据接收数据的开销远小于发送数据的开销。在移动节点无法向服务器发送数据时,仍可以从服务器的广播中接收数据,并且无线网络的广播有其特点,它支持同一无线网络的大量移动节点同时接收,并且其广播代
18、价总是一定的,不随接收的移动节点的多少而变。空中复制充分利用了无线网络的这个特点,使用适当的方式发掘并组织好热点数据,然后向无线网络中的移动节点进行广播,从而允许大规模的用户在不占用网络上行带宽的情况下同时访问到热点数据,减少了移动节点的联机开销,省下来的上行带宽还可以支持更多移动节点对服务器的访问,大大提高系统的可伸缩性。,数据广播技术中的一个首要问题是如何调度待广播的数据,优化数据广播的访问时间与调谐时间。访问时间代表了移动节点访问广播数据的等待时间,而调谐时间则反映了移动节点为接收指定数据而保持接听数据广播的总时间。为此,TTR设计了一种数据广播的启发式多盘调度算法HMD。另外,TTR还
19、研究了将客户机对服务器的联机请求访问方式(PULL)与数据广播方式(PUSH)结合起来的混合式信息访问范形.,(3)客户机缓存客户机缓存是指在移动节点上缓存服务器数据库的数据,以使移动节点在断接情况下能够通过操作缓存数据而继续工作。TTR使用一种称为MCC的机制来管理移动节点上的缓存,该机制的核心是缓存管理器CM。客户机缓存机制的工作方式如下:,当移动节点处于联机状态时,它通过直接访问服务器数据库来执行事务。缓存管理器CM一方面把移动节点的事务提交给服务器执行,另一方面向服务器申请建立并维护本地数据缓存。联机状态下的数据缓存在联机状态时并不被移动节点访问,它只是为稍后的断接操作准备数据。,当移
20、动节点处于断接状态时,它使用先前建立的数据缓存继续工作。缓存管理器CM将移动节点对缓存数据的更新操作记录在暂时事务日志中,并将更新结果记录在数据对象的暂时版本中,该更新值在整个断接期间都是可见的。,当移动节点由断接状态重新变成联机状态时,CM将断接期间的所有暂时事务及其参数发送给服务器,在服务器上重做该事务,并接收事务的结果。,三级复制体系结构的主要思想与两级复制体系结构的对比:三级复制体系结构增加了空中复制机制,充分利用了无线网络广播的特点,既支持了大规模用户同时对热点数据的访问,又节省了无线网络的上行带宽,有效提高了系统的可伸缩性,两者的复制布局存在很大的不同。三级复制体系结构中客户机缓存
21、只单纯地缓存服务器节点的数据,它只是被动地随服务器节点上数据的改变而改变,因此即使在移动节点联机操作时,移动节点上的缓存数据与服务器节点上的数据也不是处于同一个等级的;而在两级复制体系结构中,主副本是可以存在于移动节点上的,因此当移动节点处于联机状态时,其上的数据缓存跟服务器节点上的数据复制是处于同一个等级的,两者相互影响。,在复制协议上,三级复制体系结构所采用的WCSR协议要比两级复制体系结构所采用的协议要弱,因此其上也更容易产生数据的不一致性,需要更多的策略来控制数据状态的收敛。当然WCSR协议也可以以牺牲系统性能为代价支持高一致性的要求。,7.2.2 数据广播,数据广播即以广播的形式向移
22、动节点发送数据,它是针对通常的无线网络通信所具有的非对称性而提出来的。通常在无线网络内从服务器到移动节点的下行通信带宽要远大于移动节点到服务器的上行通信带宽,从通信费用来说移动节点上行发送数据的开销通常远大于下行接收数据的开销。因此用户总希望在保证移动节点能获得所需数据的情况下,尽量减少对服务器的上行通信量。数据广播在能在某种程度上满足这种要求,因为无线网络中的数据广播有一优点:服务器向无线网络广播数据的开销是固定的,而与接收广播的移动节点的数量无关。因此充分利用这一优点,由服务器选择并组织好移动用户的热点数据,以周期性的广播形式向网内的移动节点广播,便能在固定开销的情况下向大规模用户提供数据
23、了,数据广播也是数据复制技术的一种。数据广播可以看作是移动节点数据缓存的一种扩充,当移动节点所需数据不在其数据缓存内,又暂时不能跟服务器连接时(如上行通信带宽已满),移动节点还可以侦听数据广播,从数据广播中找寻其所需数据。数据广播相对于缓存有许多优点,如能轻松保证数据是最新的、不需占用移动节点有限的存储等,当然,数据广播是一种只读复制技术,即它只能支持移动节点的查询事务。,数据广播中的一个重要问题是选择及组织广播数据,这又被称为数据广播的调度问题。通常使用以下两个参数来衡量和研究数据广播的调度算法:(1)访问时间:它指从移动节点提出访问请求开始到从广播中获得结果为止所需要的时间,它用来衡量移动
24、节点查询数据的响应时间。(2)调协时间:它指移动节点为了访问数据而保持接听广播的总时间。因为移动节点接听广播需要消耗电源,因此减少调协时间便能节省移动节点本来就有限的电源供应。,在访问时间的优化上,通常的做法是采用一种称为多盘广播调度的方法。服务器通过分析移动节点的请求,并适当引入一些背景知识,归纳出用户经常访问的热点数据,并把这些数据按照访问概率再分为若干组,让访问概率高的数据在一个广播周期中出现次数多,而访问概率低的数据在一个广播周期中出现次数少。例如假设要广播A、B、C三个热点数据,移动节点对它们的访问概率的比值为2:1:1,则我们可以把一个广播周期组织为“ABAC”的形式,于是实际上数
25、据A的广播周期要比其他数据要短,从而达到了更频繁地把A广播出去的效果。,在调协时间的优化上,通常的做法是引入索引信息。在可以与服务器通信时,可以考虑从服务器中直接获取索引信息,但更通常的做法是在数据广播中插入索引信息。当移动客户机侦听数据广播时,它先侦听索引信息,再由索引信息得知所需数据到来的时间,因此移动节点便可以在数据到来前转入休眠,节省电源消耗。,7.2.3 移动查询技术,移动查询处理通常工作在无线网络环境下,由于无线网络具有带宽多样性、频繁断接性等特点,移动查询需要在传统分布式数据库查询优化技术的基础上进行改良与扩展,以适应无线网络的特殊要求,1.查询费用移动查询技术应足够灵活,综合考
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 高级 数据库技术 移动 数据库
链接地址:https://www.desk33.com/p-263444.html