摘要:说起磁盘阵列,很多人都很疑惑,磁盘阵列是什么?它的作用是什么?它是拿来干什么呢?于是很多问题就会扑面而来,而更多的问题都是在围绕着一个话题,那就是磁盘阵列作用是什么,那么小面小编就详细的讲解一下磁盘阵列有几种和磁盘阵列的好处和作用。
RAID(Redundant Array of Independent Disk 独立冗余 磁盘 阵列 ) 技术是加州大学伯克利分校 1987 年提出,最初是为了组合小的廉价磁盘来代替大的昂贵磁盘,同时希望磁盘失效时不会使对数据的访问受损失而开发出一定水平的数据保护技术。 RAID 就是一种由多块廉价磁盘构成的冗余阵列,在操作系统下是作为一个独立的大型存储设备出现。 RAID 可以充分的发挥出多块硬盘的优势,能提高硬盘速度,增大容量 , 提供容错功能保证数据安全性,易于管理的优点,在任何一块硬盘出现一些明显的异常问题的情况下都能够继续工作,不会受到损坏硬盘的影响。
即 Data Stripping 数据分条技术。 RAID 0 可以把多块硬盘连成一个容量更大的硬盘群,能大大的提升磁盘的性能和吞吐量。 RAID 0 没有冗余或错误修复能力,成本低,要求至少两个磁盘,一般只是在那些对数据安全性要求不高的情况下才被使用。
就是把 x 块同样的硬盘用硬件的形式通过智能磁盘控制器或用操作系统中的磁盘驱动程序以软件的方式串联在一起,形成一个独立的逻辑驱动器,容量是单独硬盘的 x 倍 , 在电脑数据写时被依次写入到各磁盘中,当一块磁盘的空间用尽时,数据就会被自动写入到下一块磁盘中,它的好处是能增加磁盘的容量。速度与其中任何一块磁盘的速度相同,如果其中的任何一块磁盘发生故障,总系统将会受到破坏,可靠性是单独使用一块硬盘的 1/n 。
是用 n 块硬盘选择合理的带区大小创建带区集,最好是为每一块硬盘都配备一个专门的磁盘控制器 , 在电脑数据读写时同时向 n 块磁盘读写数据 , 速度提升 n 倍。提高系统的性能。
RAID 1 称为磁盘镜像:把一个磁盘的数据镜像到另一个磁盘上,在不影响性能情况下最大限度的保证系统的可靠性和可修复性上,具备极高的数据冗余能力,但磁盘利用率为 50% ,故成本最高,多用在保存关键性的重要数据的场合。 RAID 1 有以下特点:
( 1 )、 RAID 1 的每一个磁盘都具有一个对应的镜像盘,任何一个时间里数据都同步镜像,系统能从一组镜像盘中的任何一个磁盘读取数据。
( 3 )、只要系统中任何一对镜像盘中至少有一块磁盘能够正常的使用,还可以在一半数量的硬盘出现一些明显的异常问题时系统都能够顺利运行。
( 4 )、出现硬盘故障的 RAID 系统不再可靠,应当及时的更换损坏的硬盘,否则剩余的镜像盘也出现一些明显的异常问题,那么总系统就会崩溃。
( 5 )、更换新盘后原有数据会需要很久同步镜像,外界对数据的访问不会受一定的影响,只是这时总系统的性能有所下降。
( 6 )、 RAID 1 磁盘控制器的负载相当大,用多个磁盘控制器能大大的提升数据的安全性和可用性。
把 RAID0 和 RAID1 技术结合起来,数据除分布在多个盘上外,每个盘都有其物理镜像盘,提供全冗余能力,允许一个以下磁盘故障,而不影响数据可用性,并具有快速读 / 写能力。 RAID0+1要在磁盘镜像中建立带区集至少 4 个硬盘。
电脑在写入数据时在一个磁盘上保存数据的各个位,同时把一个数据不同的位运算得到的海明校验码保存另一组磁盘上,由于海明码可以在数据发生错误的情况下将错误校正,以保证输出的正确。但海明码使用数据冗余技术,使得输出数据的速率取决于驱动器组中速度最慢的磁盘。 RAID2 控制器的设计简单。
RAID 3 使用一个专门的磁盘存放所有的校验数据,而在剩余的磁盘中创建带区集分散数据的读写操作。当一个完好的 RAID 3 系统中读取数据,只需要在数据存储盘中找到相应的数据块进行读取操作即可。但当向 RAID 3 写入数据时,必须计算与该数据块同处一个带区的所有数据块的校验值,并将新值重新写入到校验块中,这样无形虽增加系统开销。当一块磁盘失效时,该磁盘上的所有数据块一定要使用校验信息重新建立,如果所要读取的数据块正好位于已经损坏的磁盘,则必须同时读取同一带区中的所有其它数据块,并根据校验值重建丢失的数据,这使系统减慢。当更换了损坏的磁盘后,系统必须一个数据块一个数据块的重建坏盘中的数据,总系统的性能会受到严重的影响。 RAID 3 最大不足是校验盘很容易成为总系统的瓶颈,对于经常大量写入操作的应用会导致整个 RAID 系统性能的下降。 RAID 3 适合用于数据库和 WEB 服务器等。
RAID4 即带奇偶校验码的独立磁盘结构, RAID4 和 RAID3 很象,它对数据的访问是按数据块进行的,也就是按磁盘进行的,每次是一个盘, RAID4 的特点和 RAID3 也挺象,不过在失败恢复时,它的难度可要比 RAID3 大得多了,控制器的设计难度也要大许多,而且访问数据的效率不怎么好。
RAID 5 把校验块分散到所有的数据盘中。 RAID 5 使用了一种特殊的算法,可以计算出任何一个带区校验块的存放位置。这样就能保证任何对校验块进行的读写操作都会在所有的 RAID 磁盘中进行均衡,从而消除了产生瓶颈的可能。 RAID5 的读出效率很高,写入效率一般,块式的集体访问效率不错。 RAID 5 提高了系统可靠性,但对数据传输的并行性解决不好,而且控制器的设计也相当困难。
RAID6 即带有两种分布存储的奇偶校验码的独立磁盘结构,它是对 RAID5 的扩展,主要是用于要求数据一定不可以出错的场合,使用了二种奇偶校验值,所以要 N+2 个磁盘,同时对控制器的设计变得十分复杂,写入速度也不好,用于计算奇偶校验值和验证数据正确性所花费的时间相对来说比较多,造成了不必须的负载,很少人用。
RAID7 即优化的高速数据传送磁盘结构,它所有的 I/O 传送均是同步进行的,可以分别控制,这样提高了系统的并行性和系统访问数据的速度;每个磁盘都带有高速缓冲存储器,实时操作系统能够正常的使用任何实时操作芯片,达到不一样实时系统的需要。允许使用 SNMP 协议来管理和监视,可以对校验区指定独立的传送信道以提高效率。可以连接多台主机,当多用户访问系统时,访问时间几乎接近于 0 。但如果系统断电,在高速缓冲存储器内的数据就会全部丢失,因此就需要和 UPS 一起工作, RAID7 系统成本很高。
RAID10 即高可靠性与高效磁盘结构它是一个带区结构加一个镜象结构,能够达到既高效又高速的目的。这种新结构的价格高,可扩充性不好。
RAID7 即高效数据传送磁盘结构,是 RAID3 和带区结构的统一,因此它速度比较快,也有容错功能。但价格十分高,不易于实现。
磁盘阵列,就是将很多看上去很不起眼,价值很低的磁盘来进行数组组合的一类磁盘组。每一类的磁盘组都是不一样的,它也被分为三种形式,这中间还包括外接式和内接式,还有一类是利用软件仿真的技术。在不同的使用中,它的作用也是不一样的。
就磁盘阵列来说,简单的分析,它是一种合成硬盘,而它的重要功能就是使数据传输时效率增加,数据得到保障,磁盘阵列也被分为几个级别,级别不同,安全性和作用功能都有一定的差异,但能确保安全的使用和调用数据。
磁盘阵列就是一种很大的 “容器”,它可以装载许多数据。由于它是由许多硬盘组合而成的,它对数据的容量较大,传输速度较快,使用起来更便捷,并且数据的安全得到保证。
外接式的磁盘阵列的应用限制范围多在一些较大的服务器上,所以在价格这一块,就比较昂贵。而内接式磁盘阵列就恰恰相反,不仅价格实惠公道,并能为用户们提供许多有价值、可靠性、可用性较高的解决方案,能做到自动数据恢复,高速缓冲等等。
上述中提到的利用软件仿真技术的方式,它会将多个硬盘进行组合和链接配置,构成一种不适合用在有大数据流量的磁盘阵列,这样的方式,虽然为磁盘增添了一些功能,却存在一定的缺陷,就是会拖累 磁盘 运行的系统性能。
不同的应用上,它的作用都是不同的,当它应用于直接访问存储设备中的时候,它变成了硬盘设备中的最新形式。当它应用于网络附加存储设备的时候,它就可以为一些系统的平台提供文件资料共享。当它应用于存储区域网的时候,它可以为其提供可靠性和可行性高的解决方案。