DBMS和数据仓库的区别及联系.docx
《DBMS和数据仓库的区别及联系.docx》由会员分享,可在线阅读,更多相关《DBMS和数据仓库的区别及联系.docx(10页珍藏版)》请在课桌文档上搜索。
1、在数据仓库技术以前,只存在事务处理,DBMS系统为这种处理类型的需要提供支持。但是,在数据仓库中的处理是截然不同的。数据仓库环境中的处理类型可以概括为装载和访问过程。数据从原来操作型数据环境和ODS中集成、转换和装载到数据仓库中去。一旦进入数据仓库,集成的数据就在那里访问和分析。在数据仓库中,数据一旦被装载,通常是不更新的。如果需要对数据仓库更正和调整的话,也是在对数据仓库数据没有分析操作的空闲时间进行。而且,这些改变也是通过加入一个当前的数据快照来完成。传统的事务处理数据库环境和数据仓库环境的另一个重要的区别在于,数据仓库环境中有很多的数据,比一般的操作型环境中要多得多,以万亿或千万亿计,而
2、一个通用的DBMS通常管理下的传统事务处理数据库中的数据要少得多。数据仓库要管理大量的数据,是因为它们包括如下内容:- 粒化的原子细节。- 历史信息。- 细节和汇总数据。谈到基本的数据管理功能,数据仓库用与标准的操作型DBMS非常不同的一组参数进行优化。传统的通用DBMS和数据仓库专用DBMS的第一个也是最重要的区别在于数据更新是如何进行的。传统的通用DBMS必须将记录级的、基于事务的更新作为一个正常的操作部分。由于记录级、基于事务的数据更新是通用DBMS的一般特征,所以它必须提供以下功能:- 锁定。- 提交。- 检查点。- 日志磁带处理。- 死锁。- 逆向恢复。不仅这些特征确实已成为DBMS
3、一个常规部分,它们的开销也是巨大的。有趣的是,当DBMS不使用时也要耗费这笔开销。换句话说,当通用DBMS仅执行只读操作时,DBMS也至少要提供更新和锁定的开销(取决于DBMS)o根据不同的通用DBMS,更新所需的开销能不同程度地最小化,但不能完全没有。而对于一个数据仓库专用的DBMS来说,不用支付任何更新所需的开销。通用DBMS和数据仓库专用DBMS之间的第二个主要区别是对基本数据的管理的不同。对于通用的DBMS来说,对数据在块级上的管理要包括一些附加的空间,这些空间是用于以后更新和插入数据时块的扩展。一般情况下,这些空间是自由空间。对于通用DBMS,自由空间可能占到50%。对于数据仓库专用
4、的DBMS,根本就不需要自由空间,因为数据一旦装入到数据仓库后是不需要更新的,也就没有物理块扩展的需要。事实上,给定了数据仓库中要管理的数据量后,留下以后将永远不会用到的大量空间是没有任何意义的。数据仓库和通用环境之间的另一个相关的区别反映在不同类型的DBMS上,是索引的区别。通用DBMS环境限制在有限数量的索引,这个限制是因为当有数据的更新和插入时,索引本身需要空间和数据管理。然而,在数据仓库环境中没有数据的更新,却有必要对数据的访问进行优化,也有多种索引的必要(和机会)。事实上,数据仓库相对于操作型的、面向更新的数据库来说,能够应用更稳健和更完善的索引结构。除了索引、更新和物理块级上的基本
5、数据管理以外,在数据管理能力和策略上,通用DBMS和数据仓库专用DBMS之间还存在其他一些基本区别。其中,这两种类型的DBMS最基本的区别可能是在物理上以优化方式组织数据以适应不同类型访问的能力。通用DBMS在物理上组织数据是为了优化事务的访问和处理。以这种方式进行的组织使得许多不同类型的数据可以根据一个公共关键字聚集起来,并能有效地通过1次或2次I/O访问。最适合于信息型访问的数据通常具有一个区别很大的物理描述。最适合于信息型访问的数据是经过组织的,可以使对同一类型数据的许多不同值能够通过1次或2次物理I/O高效地进行访问。数据能够在物理上得到优化以便于事务访问或DSS访问,但无法同时做到这
6、两点。通用的、基于事务的DBMS只针对事务访问对数据进行优化,而数据仓库专用的DBMS则针对DSS访问和分析在物理上对数据进行优化。改变DBMS技术信息仓库需要考虑的一个有趣的因素是,在数据仓库数据已经载入以后,DBMS技术发生变化。有以下几个原因说明进行这种改变:- 当今可用的DBMS技术,在数据仓库首次载入数据时并不一定适合。- 数据仓库大小已经增长到一定的程度,要求提出新的技术方法。- 对数据仓库的使用逐步增加,也发生了很多变化,使得当前的数据仓库的DBMS技术不满足要求了。- 需要不时地对基本的DBMS选择进行审查。是否应考虑找一种新的DBMS技术?要考虑的因素是什么?以下的几点非常重
7、要:- 新的DBMS技术是否满足可预知的需求?- 从旧的DBMS技术向新的DBMS技术的转换应该怎样去做?- 转换的程序应该怎样改变?所有的这些考虑因素中,最后一个是最令人头痛的。即使在最好的情况下,试图去改变转换程序也是一项很复杂的工作。事实上,一旦数据仓库已经采用了一个DBMS,在以后某个时间进行更改是可能的。但这种情况在事务处理的过程中是永远不可能的,因为一旦采用了一个DBMS,只要事务处理系统仍在运行当中,这个DBMS就必须保持不动。多维DBMS和数据仓库一项在数据仓库中经常讨论的技术是多维数据库管理系统处理(有时称为OLAP处理)。多维数据库管理系统或者数据集市提供了一种信息系统结构
8、,这种结构可以使企业灵活地对数据进行访问,可以用多种方法对数据进行切片、分块,动态地考察汇总数据和细节数据之间的关系。多维DBMS为最终用户提供了灵活性和控制功能。为此,它非常适合于DSS环境。如图1所示,多维DBMS和数据仓库之间存在着非常有趣和互补的关系。轻度综合的数据集市多维 DBMS(OLAP)当前细Yj图1数据仓库的传统结构以及当前细节数据是如何同部门数据(或多维DBMS,数据集市)结合起来的数据仓库中的细节数据为多维DBMS提供了非常稳健和方便的数据源。因为多维DBMS需要定期地刷新,为此,数据要定期从数据仓库中导入到多维DBMS中。由于历史应用数据在进入数据仓库时被集成,多维DB
9、MS就不再需要从操作型环境中抽取与集成它所需要的数据。另外,数据仓库在最低级别上保存了数据,这样就能为那些使用多维DBMS的用户在需要的时候进行的低级别分析提供“基础”数据。可能有人会认为多维DBMS技术应该是用于数据仓库的数据库技术,事实上除一些非常特殊的情况外,这种想法是不正确的。那些为了多维DBMS技术的功能而对其进行优化的性质并不是数据仓库的最基本的重要特性。数据仓库中最重要的特性也不是多维DBMS技术的特性。看一下数据仓库和多维DBMS的区别:- 数据仓库有大量的数据;多维DBMS中的数据至少要少一个数量级。- 数据仓库只适于少量的灵活访问;而多维DBMS适合大量的不可预知的数据访问
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- DBMS 数据仓库 区别 联系
链接地址:https://www.desk33.com/p-748766.html