磁盘阵列知识点梳理汇总.docx
前言RAID,独立硬盘冗余阵列(RAlD,RedundantArrayofIndependentDisks),简称磁盘阵列。其基本思想就是把多个相对便宜的硬盘组合起来,成为一个硬盘阵列组,使性能达到甚至超过一个价格昂贵、容量巨大的硬盘。根据选择的版本不同,RAID比单颗硬盘有以下一个或多个方面的好处:增强数据集成度,增强容错功能,增加处理量或容量。另外,磁盘阵列对于电脑来说,看起来就像一个单独的硬盘或逻辑存储单元。RAID基础知识基本原理RAID(RedundantArrayofIndependentDisks)即独立磁盘冗余阵列,通常简称为磁盘阵列。简单地说,RAID是由多个独立的高性能磁盘驱动器组成的磁盘子系统,从而提供比单个磁盘更高的存储性能和数据冗余的技术。RAID是一类多磁盘管理技术,其向主机环境提供了成本适中、数据可靠性高的高性能存储。SNIA对RAID的定义是:一种磁盘阵列,部分物理存储空间用来记录保存在剩余空间上的用户数据的冗余信息。当其中某一个磁盘或访问路径发生故障时,冗余信息可用来重建用户数据。磁盘条带化虽然与RAID定义不符,通常还是称为RAID(即RID0)0RAID的初衷是为大型服务器提供高端的存储功能和冗余的数据安全。在整个系统中,RAID被看作是由两个或更多磁盘组成的存储空间,通过并发地在多个磁盘上读写数据来提高存储系统的I/O性能。大多数RAID等级具有完备的数据校验、纠正措施,从而提高系统的容错性,甚至镜像方式,大大增强系统的可靠性,RedUndant也由此而来。RAID的两个关键目标是提高数据可靠性和I/O性能。磁盘阵列中,数据分散在多个磁盘中,然而对于计算机系统来说,就像一个单独的磁盘。通过把相同数据同时写入到多块磁盘(典型地如镜像),或者将计算的校验数据写入阵列中来获得冗余能力,当单块磁盘出现故障时可以保证不会导致数据丢失。有些RAID等级允许更多地磁盘同时发生故障,比如RAID6,可以是两块磁盘同时损坏。在这样的冗余机制下,可以用新磁盘替换故障磁盘,RAID会自动根据剩余磁盘中的数据和校验数据重建丢失的数据,保证数据一致性和完整性。数据分散保存在RAID中的多个不同磁盘上,并发数据读写要大大优于单个磁盘,因此可以获得更高的聚合I/O带宽。当然,磁盘阵列会减少全体磁盘的总可用存储空间,牺牲空间换取更高的可靠性和性能。比如,RAIDl存储空间利用率仅有50%,RAID5会损失其中一个磁盘的存储容量,空间利用率为(n-l)no磁盘阵列可以在部分磁盘(单块或多块,根据实现而论)损坏的情况下,仍能保证系统不中断地连续运行。在重建故障磁盘数据至新磁盘的过程中,系统可以继续正常运行,但是性能方面会有一定程度上的降低。一些磁盘阵列在添加或删除磁盘时必须停机,而有些则支持热交换(HotSwapping),允许不停机下替换磁盘驱动器。这种高端磁盘阵列主要用于要求高可能性的应用系统,系统不能停机或尽可能少的停机时间。一般来说,RAID不可作为数据备份的替代方案,它对非磁盘故障等造成的数据丢失无能为力,比如病毒、人为破坏、意外删除等情形。此时的数据丢失是相对操作系统、文件系统、卷管理器或者应用系统来说的,对于RAID系统来身,数据都是完好的,没有发生丢失。所以,数据备份、灾备等数据保护措施是非常必要的,与RAID相辅相成,保护数据在不同层次的安全性,防止发生数据丢失。RAID中主要有三个关键概念和技术:镜像(MirrOring)、数据条带(DataStripping)和数据校验(Dataparity)。镜像,将数据复制到多个磁盘,一方面可以提高可靠性,另一方面可并发从两个或多个副本读取数据来提高读性能。显而易见,镜像的写性能要稍低,确保数据正确地写到多个磁盘需要更多的时间消耗。数据条带,将数据分片保存在多个不同的磁盘,多个数据分片共同组成一个完整数据副本,这与镜像的多个副本是不同的,它通常用于性能考虑。数据条带具有更高的并发粒度,当访问数据时,可以同时对位于不同磁盘上数据进行读写操作,从而获得非常可观的I/O性能提升。数据校验,利用冗余数据进行数据错误检测和修复,冗余数据通常采用海明码、异或操作等算法来计算获得。利用校验功能,可以很大程度上提高磁盘阵列的可靠性、鲁棒性和容错能力。不过,数据校验需要从多处读取数据并进行计算和对比,会影响系统性能。不同等级的RAlD采用一个或多个以上的三种技术,来获得不同的数据可靠性、可用性和I/O性能。至于设计何种RAID(甚至新的等级或类型)或采用何种模式的RAlD,需要在深入理解系统需求的前提下进行合理选择,综合评估可靠性、性能和成本来进行折中的选择。RAID思想从提出后就广泛被业界所接纳,存储工业界投入了大量的时间和财力来研究和开发相关产品。而且,随着处理器、内存、计算机接口等技术的不断发展,RAID不断地发展和革新,在计算机存储领域得到了广泛的应用,从高端系统逐渐延伸到普通的中低端系统。RAID技术如此流行,源于其具有显著的特征和优势,基本可以满足大部分的数据存储需求。总体说来,RAID主要优势有如下几点:(1)大容量这是RAID的一个显然优势,它扩大了磁盘的容量,由多个磁盘组成的RAID系统具有海量的存储空间。现在单个磁盘的容量就可以到ITB以上,这样RAID的存储容量就可以达到PB级,大多数的存储需求都可以满足。一般来说,RAID可用容量要小于所有成员磁盘的总容量。不同等级的RAlD算法需要一定的冗余开销,具体容量开销与采用算法相关。如果已知RAID算法和容量,可以计算出RAID的可用容量。通常,RAID容量利用率在50%90%之间。(2)高性能RAID的高性能受益于数据条带化技术。单个磁盘的I/O性能受到接口、带宽等计算机技术的限制,性能往往很有限,容易成为系统性能的瓶颈。通过数据条带化,RAID将数据I/O分散到各个成员磁盘上,从而获得比单个磁盘成倍增长的聚合I/O性能。(3)可靠性可用性和可靠性是RAID的另一个重要特征。从理论上讲,由多个磁盘组成的RAID系统在可靠性方面应该比单个磁盘要差。这里有个隐含假定:单个磁盘故障将导致整个RAID不可用。RAID采用镜像和数据校验等数据冗余技术,打破了这个假定。镜像是最为原始的冗余技术,把某组磁盘驱动器上的数据完全复制到另一组磁盘驱动器上,保证总有数据副本可用。比起镜像50%的冗余开销,数据校验要小很多,它利用校验冗余信息对数据进行校验和纠错。RAlD冗余技术大幅提升数据可用性和可靠性,保证了若干磁盘出错时,不会导致数据的丢失,不影响系统的连续运行。(4)可管理性实际上,RAID是一种虚拟化技术,它对多个物理磁盘驱动器虚拟成一个大容量的逻辑驱动器。对于外部主机系统来说,RAID是一个单一的、快速可靠的大容量磁盘驱动器。这样,用户就可以在这个虚拟驱动器上来组织和存储应用系统数据。从用户应用角度看,可使存储系统简单易用,管理也很便利。由于RAID内部完成了大量的存储管理工作,管理员只需要管理单个虚拟驱动器,可以节省大量的管理工作。RAID可以动态增减磁盘驱动器,可自动进行数据校验和数据重建,这些都可以大大简化管理工作。关键技术镜像镜像是一种冗余技术,为磁盘提供保护功能,防止磁盘发生故障而造成数据丢失。对于RAID而言,采用镜像技术典型地将会同时在阵列中产生两个完全相同的数据副本,分布在两个不同的磁盘驱动器组上。镜像提供了完全的数据冗余能力,当一个数据副本失效不可用时,外部系统仍可正常访问另一副本,不会对应用系统运行和性能产生影响。而且,镜像不需要额外的计算和校验,故障修复非常快,直接复制即可。镜像技术可以从多个副本进行并发读取数据,提供更高的读I/O性能,但不能并行写数据,写多个副本会会导致一定的I/O性能降低。镜像技术提供了非常高的数据安全性,其代价也是非常昂贵的,需要至少双倍的存储空间。高成本限制了镜像的广泛应用,主要应用于至关重要的数据保护,这种场合下数据丢失会造成巨大的损失。另外,镜像通过“拆分”能获得特定时间点的上数据快照,从而可以实现一种备份窗口几乎为零的数据备份技术。数据条带磁盘存储的性能瓶颈在于磁头寻道定位,它是一种慢速机械运动,无法与高速的CPU匹配。再者,单个磁盘驱动器性能存在物理极限,I/O性能非常有限。RAID由多块磁盘组成,数据条带技术将数据以块的方式分布存储在多个磁盘中,从而可以对数据进行并发处理。这样写入和读取数据就可以在多个磁盘上同时进行,并发产生非常高的聚合I/O,有效提高了整体I/O性能,而且具有良好的线性扩展性。这对大容量数据尤其显著,如果不分块,数据只能按顺序存储在磁盘阵列的磁盘上,需要时再按顺序读取。而通过条带技术,可获得数倍与顺序访问的性能提升。数据条带技术的分块大小选择非常关键。条带粒度可以是一个字节至几KB大小,分块越小,并行处理能力就越强,数据存取速度就越高,但同时就会增加块存取的随机性和块寻址时间。实际应用中,要根据数据特征和需求来选择合适的分块大小,在数据存取随机性和并发处理能力之间进行平衡,以争取尽可能高的整体性能。数据条带是基于提高I/O性能而提出的,也就是说它只关注性能,而对数据可靠性、可用性没有任何改善。实际上,其中任何一个数据条带损坏都会导致整个数据不可用,采用数据条带技术反而增加了数据发生丢失的概念率。数据校验镜像具有高安全性、高读性能,但冗余开销太昂贵。数据条带通过并发性来大幅提高性能,然而对数据安全性、可靠性未作考虑。数据校验是一种冗余技术,它用校验数据来提供数据的安全,可以检测数据错误,并在能力允许的前提下进行数据重构。相对镜像,数据校验大幅缩减了冗余开销,用较小的代价换取了极佳的数据完整性和可靠性。数据条带技术提供高性能,数据校验提供数据安全性,RAID不同等级往往同时结合使用这两种技术。采用数据校验时,RAID要在写入数据同时进行校验计算,并将得到的校验数据存储在RAID成员磁盘中。校验数据可以集中保存在某个磁盘或分散存储在多个不同磁盘中,甚至校验数据也可以分块,不同RAID等级实现各不相同。当其中一部分数据出错时,就可以对剩余数据和校验数据进行反校验计算重建丢失的数据。校验技术相对于镜像技术的优势在于节省大量开销,但由于每次数据读写都要进行大量的校验运算,对计算机的运算速度要求很高,必须使用硬件RAID控制器。在数据重建恢复方面,检验技术比镜像技术复杂得多且慢得多。海明校验码和异或校验是两种最为常用的数据校验算法。海明校验码是由理查德海明提出的,不仅能检测错误,还能给出错误位置并自动纠正。海明校验的基本思想是:将有效信息按照某种规律分成若干组,对每一个组作奇偶测试并安排一个校验位,从而能提供多位检错信息,以定位错误点并纠正。可见海明校验实质上是一种多重奇偶校验。异或校验通过异或逻辑运算产生,将一个有效信息与一个给定的初始值进行异或运算,会得到校验信息。如果有效信息出现错误,通过校验信息与初始值的异或运算能还原正确的有效信息。常见RAID类型常见5种RAlD类型对比,n位磁盘数量。RAID等级RAIDORAID1RAID5RAID6RAID10别名条带镜像分布奇偶校验条带双重奇偶校验条带镜像加条带容错性无有有有有冗余类型无有有有有热备盘无有有有有读性能高低高高高随机写性能高低一般低一般连续写性能高低低低一般需要磁盘数n12n(n1)n3n42n(n2)4可用容量全部50%(n-1)n(n-2)n50%RAID等级标准RAID等级SNIA、Berkeley等组织机构把RAIDO、RAIDl、RAID2、RAID3、RAID4、RAID5、RAID6七个等级定为标准的RAID等级,这也被业界和学术界所公认。标准等级是最基本的RAID配置集合,单独或综合利用数据条带、镜像和数据校验技术。标准RAID可以组合,即RAID组合等级,满足对性能、安全性、可靠性要求更高的存储应用需求。JBODJBOD(JustaBunchOfDisks)不是标准的RAID等级,它通常用来表示一个没有控制软件提供协调控制的磁盘集合。JBOD将多个物理磁盘串联起来,提供一个巨大的逻辑磁盘。JBOD的数据存放机制是由第一块磁盘开始按顺序往后存储,当前磁盘存储空间用完后,再依次往后面的磁盘存储数据。JBOD存储性能完全等同于单块磁盘,而且也不提供数据安全保护。它只是简单提供一种扩展存储空间的机制,JBOD可用存储容量等于所有成员磁盘的存储空间之和。目前JBOD常指磁盘柜,而不论其是否提供RAID功能。JBOD、A64jA66jA92.A9333<A4><A67.A95.Disk0Disk1Disk2RAIDORAIDO是一种简单的、无数据校验的数据条带化技术。实际上不是一种真正的RAID,因为它并不提供任何形式的冗余策略。RAIDO将所在磁盘条带化后组成大容量的存储空间,将数据分散存储在所有磁盘中,以独立访问方式实现多块磁盘的并读访问。由于可以并发执行I/O操作,总线带宽得到充分利用。再加上不需要进行数据校验,RAIDO的性能在所有RAID等级中是最高的。理论上讲,一个由n块磁盘组成的RAIDO,它的读写性能是单个磁盘性能的n倍,但由于总线带宽等多种因素的限制,实际的性能提升低于理论值。RAIDO具有低成本、高读写性能、100%的高存储空间利用率等优点,但是它不提供数据冗余保护,一旦数据损坏,将无法恢复。因此,RAIDO一般适用于对性能要求严格但对数据安全性和可靠性不高的应用,如视频、音频存储、临时数据缓存空间等。RAIDlRAIDl称为镜像,它将数据完全一致地分别写到工作磁盘和镜像磁盘,它的磁盘空间利用率为50%ORAIDl在数据写入时,响应时间会有所影响,但是读数据的时候没有影响。RAIDl提供了最佳的数据保护,一旦工作磁盘发生故障,系统自动从镜像磁盘读取数据,不会影响用户工作。RAIDl与RAIDO刚好相反,是为了增强数据安全性使两块磁盘数据呈现完全镜像,从而达到安全性好、技术简单、管理方便。RAIDl拥有完全容错的能力,但实现成本高。RAIDl应用于对顺序读写性能要求高以及对数据保护极为重视的应用,如对邮件系统的数据保护。RAID2、3、4RAID2、3、4较少实际应用,它们大多只在研究领域有实作。RAID5RAID5应该是目前最常见的RAID等级,它的原理与RAID4相似,区别在于校验数据分布在阵列中的所有磁盘上,而没有采用专门的校验磁盘。对于数据和校验数据,它们的写操作可以同时发生在完全不同的磁盘上。因此,RAID5不存在RAID4中的并发写操作时的校验盘性能瓶颈问题。另外,RAID5还具备很好的扩展性。当阵列磁盘数量增加时,并行操作量的能力也随之增长,可比RAID4支持更多的磁盘,从而拥有更高的容量以及更高的性能。RAlD5的磁盘上同时存储数据和校验数据,数据块和对应的校验信息存保存在不同的磁盘上,当一个数据盘损坏时,系统可以根据同一条带的其他数据块和对应的校验数据来重建损坏的数据。与其他RAID等级一样,重建数据时,RAID5的性能会受到较大的影响。RAID5兼顾存储性能、数据安全和存储成本等各方面因素,它可以理解为RAIDO和RAIDl的折中方案,是目前综合性能最佳的数据保护解决方案。RAID5基本上可以满足大部分的存储应用需求,数据中心大多采用它作为应用数据的保护方案。RAID5DiskODisk1Disk2Disk3RAID6前面所述的各个RAID等级都只能保护因单个磁盘失效而造成的数据丢失。如果两个磁盘同时发生故障,数据将无法恢复。RAID6引入双重校验的概念,它可以保护阵列中同时出现两个磁盘失效时,阵列仍能够继续工作,不会发生数据丢失。RAID6等级是在RAID5的基础上为了进一步增强数据保护而设计的一种RAID方式,它可以看作是一种扩展的RAID5等级。RAID6不仅要支持数据的恢复,还要支持校验数据的恢复,因此实现代价很高,控制器的设计也比其他等级更复杂、更昂贵。RAID6思想最常见的实现方式是采用两个独立的校验算法,假设称为P和Q,校验数据可以分别存储在两个不同的校验盘上,或者分散存储在所有成员磁盘中。当两个磁盘同时失效时,即可通过求解两元方程来重建两个磁盘上的数据。RAID6具有快速的读取性能、更高的容错能力。但是,它的成本要高于RAID5许多,写性能也较差,并有设计和实施非常复杂。因此,RAID6很少得到实际应用,主要用于对数据安全等级要求非常高的场合。它一般是替代RAIDlO方案的经济性选择RAID6RAID7RAID7并非公开的RAID标准,而是StorageComputerCorporation的专利硬件产品名称。RAlD7的效能超越了许多其他RAlD标准的实做产品,但也因为如此,在价格方面非常的高昂。RAID组合等级标准RAID等级各有优势和不足。自然地,我们想到把多个RAID等级组合起来,实现优势互补,弥补相互的不足,从而达到在性能、数据安全性等指标上更高的RAID系统。目前在业界和学术研究中提到的RAID组合等级主要有RAIDOO、RAIDOl、RAIDlO、RAID100、RAID30、RAID50、RAID53、RAID60,但实际得到较为广泛应用的只有RAIDOl和RAIDlO两个等级。当然,组合等级的实现成本一般都非常昂贵,只是在少数特定场合应用。RAIDlO和RAIDOl一些文献把这两种RAID等级看作是等同的,本文认为是不同的。RAIDOl是先做条带化再作镜像,本质是对物理磁盘实现镜像;而RAIDlO是先做镜像再作条带化,是对虚拟磁盘实现镜像。相同的配置下,通常RAIDOl比RAIDlO具有更好的容错能力。RAIDOl兼备了RAIDO和RAIDl的优点,它先用两块磁盘建立镜像,然后再在镜像内部做条带化。RAIDOl的数据将同时写入到两个磁盘阵列中,如果其中一个阵列损坏,仍可继续工作,保证数据安全性的同时又提高了性能。RAIDOl和RAIDlO内部都含有RAIDl模式,因此整体磁盘利用率均仅为50%。RAID1+0RAID0RAID1RAID1Disk0Disk1Disk2Disk3RAID0+1RAID1RAID0RAID0Disk2Disk3RAID50RAID5与RAID0的组合,先作RAID5,再作RAlD0,也就是对多组RAID5彼此构成StriPe访问。由于RAID50是以RAlD5为基础,而RAn)5至少需要3颗硬盘,因此要以多组RAn)5构成RAID50,至少需要6颗硬盘。以RAlD50最小的6颗硬盘配置为例,先把6颗硬盘分为2组,每组3颗构成RAID5,如此就得到两组RAID5,然后再把两组RAID5构成RAlDOoRAID50在底层的任一组或多组RAID5中出现1颗硬盘损坏时,仍能维持运作,不过如果任一组RAlD5中出现2颗或2颗以上硬盘损毁,整组RAID50就会失效。RAID50由于在上层把多组RAlD5构成StriPe,性能比起单纯的RAlD5高,容量利用率比RAID5要低。比如同样使用9颗硬盘,由各3颗RAID5再组成RAID0的RAID50,每组RAlD5浪费一颗硬盘,利用率为(1-3/9),RAID5则为(1-1/9)。RAID60RAID6与RAID0的组合:先作RAID6,再作RAlDOo换句话说,就是对两组以上的RAlD6作StriPe访问。RAID6至少需具备4颗硬盘,所以RAlD60的最小需求是8颗硬盘。由于底层是以RAlD6组成,所以RAID60可以容许任一组RAID6中损毁最多2颗硬盘,而系统仍能维持运作;不过只要底层任一组RAlD6中损毁3颗硬盘,整组RAlD60就会失效,当然这种情况的概率相当低。比起单纯的RAlD6,RAID60的上层通过结合多组RAlD6构成StriPe访问,因此性能较高。不过使用门槛高,而且容量利用率低是较大的问题。RAID60RAlDO理解RAID2.0和RAID2.0+RAID2.0(独立磁盘冗余数组2.0,RedundantArrayofIndependentDisksVersion2.0),为增强型RAlD技术,有效解决了机械硬盘容量越来越大,重构一块机械硬盘所需时间越来越长,传统RAID组重构窗口越来越大而导致重构期间又故障一块硬盘而彻底丢失数据风险的问题。其基本思想就是把大容量机械硬盘先按照固定的容量切割成多个更小的分块(Chunk,通常为64MB),RAlD组建立在这些小分块上,而不是某些硬盘上,我们称为分块组(ChunkGroup)o此时硬盘间不再组成传统的RAID关系,而是组成更大硬盘数量的硬盘组(建议最大硬盘数量为96T20,不建议超过120块盘),每个硬盘上不同的分块可与此硬盘组上不同硬盘上的分块组成不同RAlD类型的分块组,这样一个硬盘上的分块可以属于多个RAlD类型的多个分块组。以这样的组织形式,基于RAID2.0技术的存储系统能够做到在一块硬盘故障后,在硬盘组上的所有硬盘上并发进行重构,而不再是传统RAID的单个热备盘上进行重构,从而大大降低重构时间,减少重构窗口扩大导致的数据丢失风险,在硬盘容量大幅增加的同时确保存储系统的性能和可靠性。RAID2.0并没有改变传统的各种RAlD类型的算法,而是把RAlD范围缩小到分块组上。因此,RAID2.0技术具备以下技术特征:几个、几十个甚至上百个机械硬盘组成硬盘组;硬盘组中的硬盘被分割成几十兆、上百兆的分块,不同硬盘上的分块组成的分块组(ChunkGroup);RAID计算在分块组(ChunkGroup)内进行,系统不再有热备盘,而是被同一分块组内保留的热备块所代替。固化的硬盘划分基于传统RAID技术的存储阵列故障恢复机制基于RAID2.0技术的存储阵列故隙恢复机制由于RAID2.O系统中一块硬盘故障后,重构可以在同一硬盘组内其他所有硬盘保留的热备空间上并发进行,使用RAID2.0技术的存储系统具备以下优势:快速重构:存储池内所有硬盘参与重构,相对于传统RAID重构速度大幅提;自动负载均衡:RAn)2.0使得各硬盘均衡分担负载,不再有热点硬盘,提升了系统的性能和硬盘可靠性;系统性能提升:1.UN基于分块组创建,可以不受传统RAll)硬盘数量的限制分布在更多的物理硬盘上,因而系统性能随硬盘IO带宽增加得以有效提升;自愈合:当出现硬盘预警时,无需热备盘,无需立即更换故障盘,系统可快速重构,实现自愈合。RAID2.0+(独立磁盘冗余数组2.O,RedundantArrayofIndependentDisksVersion2.0+)在RAID2.0的基础上提供了更细粒度(可以达几十KB粒度)的资源颗粒,形成存储资源的标准分配及回收单位,类似计算虚拟化中的虚拟机,我们称之为虚拟块。这些容量单位一致的虚拟块构成了一个统一的存储资源池,所有应用、中间件、虚拟机、操作系统所需的资源可以在这个资源池中按需分配及回收。相对传统RAID系统,RAID2.0+技术实现了存储资源的虚拟化及预配置,存储资源的申请及释放完全自动化的通过存储池实现,而不再需要传统RAID阵列的RAID组创建,1.UN创建,1.UN格式化等耗时而容易出错的手工配置过程。因此,RAID2.0+技术解决了虚拟机环境下,存储资源必须动态按需分配及释放的问题。在RAID2.0基础上,RAID2.0+技术具备以下技术特征:在RAID2.0基础上,分块组(ChunkGroup)被切分为容量从256KB到64MB的虚拟化存储颗粒(Extent);存储资源以以上颗粒为单位自动分配及释放;可以以以上颗粒度为单位在存储池内或不同存储池间进行细粒度分级存储;在系统通过扩展控制器扩展性能或容量后,可以通过自动化的迁移这些标准颗粒来达到负载均衡的目的。底层虚拟化技术RAID2.0上层虚拟化技术RAID2.0÷夕InternalDisk1.d1.d1.d1.d1.d1.d1.d1.dMi吕吕】ExternalDiskFCSCSVFCOENFSZCIFSS3SmartVirtuaIization基于RAID2.0+技术的存储阵列技术优点RAID2.0+技术主要用于实现系统资源的智能分配,满足虚拟机环境对存储的需求:存储资源按需自动化分配及释放,满足了虚拟机对存储最本质的需求;根据推泅设定理论存储空间E电电电呼存僧容虚拟化TTT存储黄源池硬总奥海存储降列基于RAlD2.0+技术的存储容量虚拟化可根据业务实时情况,将不同数据分级存储,通过灵活调配SSD等高性能存储资源满足高性能业务需求;按照访问频率排名,自动迁移®<4>G)EAOoSSDtierOOSAStierN1.SAStier基于RAID2.0+技术的实时资源调配根据业务特点自动迁移数据,提高存储利用效率;基于RAlD2.0+技术的自动数据迁移RAID2.0与传统RAlD的对比伯悦RAlD重构Kitf(多对)RAID2.0+重构原理(多对冬)ODKl2I34RAID5(4*11不爸逑找HDDQHDD1HDO241FglIHFMMIIBEBjHDD33353。HDD4CKGOIRAlD5)CKGIRAD5)HDDSla,8283GJmKJI¾ltJF3KiiEaEaEE9M印中C3EEIE1B3CKG2(RAIDS)E3ta田田西口效妄伟传统RAID和RAlD2.0+两种技术重构原理的对比传统RAID和RAlD2.0+两种技术重构性能的对比不适合使用RAID的场景Hadoop集群中为何不使用RAID?尽管建议采用RAIl)(RedundantArrayofIndependentDisk,即磁盘阵列)作为namenode的存储器以保护元数据,但是若将RAID作为datanode的存储设备则不会给HDFS带来益处。HDFS所提供的节点间数据复制技术己可满足数据备份需求,无需使用RAID的冗余机制。此外,尽管RAID条带化技术(RAlD0)被广泛用户提升性能,但是其速度仍然比用在HDFS里的JBOD(JustaBunchOfDisks)配置慢。JBOD在所有磁盘之间循环调度HDFS块。RAID0的读写操作受限于磁盘阵列中最慢盘片的速度,而JBOD的磁盘操作均独立,因而平均读写速度高于最慢盘片的读写速度。需要强调的是,各个磁盘的性能在实际使用中总存在相当大的差异,即使对于相同型号的磁盘。针对某一雅虎集群的评测报告(http:/markmai1.Org/message/XmZC45zi25htr7ry)表明,在一个测试(GridmiX)中,JBOD比RAID0快10%;在另一测试(HDFS写吞吐量)中,JBOD比RAID0快30%O最后,若JBOD配置的某一磁盘出现故障,HDFS可以忽略该磁盘,继续工作。而RAID的某一盘片故障会导致整个磁盘阵列不可用,进而使相应节点失效。