总结的话就是:多个磁盘被同时读写,用来存取数据,组成的这个高性能高可靠性的阵列就是磁盘阵列了。
而磁带库是 多个磁带被用来共同读写,存取数据。他好像也组成了个磁带阵列,但是这个阵列更多是用来存数据的,存好放起来,由于性能低下,并不能实时响应用户请求,就是作为个数据仓库,用来长久的存放数据。而本身一台设备,内部有多个磁带,它就像是一个专门放置磁带的仓库,所以我们常叫它磁带库。
磁盘阵列和磁带库都有其存在的价值,磁盘阵列不用多说了,实时满足用户请求访问,目前IT行业大量用到。我简单说下带库吧,这个目前用的人相对服务器,盘柜用户,确实稀少,很多ITer根本不会使用。一般企业也不需要。他们的数据量基本上用不到这磁带库。
磁带库内是有多个磁带的,当我们要存储数据时候,只需要通过管理磁带机的pc或服务器,发送需要存储起来的数据,磁带机就自动把磁带,通过带库里的抓取臂把一个磁带装入磁带机内,进行读写,读写完了,把磁带重新放回去,你也可以指定磁带库使用那个磁带来存数据(图形界面的控制)。顺便说下,有的服务器可以选配一个磁带机,然后你自己手动每次给他换磁带,就像光驱那样,存满了,取出来,换新的磁带进去。而带库好处就是省去了更换的换磁带的人工干预,它可以长期的存储数据,因为内部多个磁带肯定存储的数据量也大,很久都不用换磁带。
这个磁带不是以前咱们录音机的那种,个头大了,也是靠分析磁极N,S来存储0,1的数据,是数字信号。而咱们以前录音机的磁带是磁头分析磁性大小,转化成模拟的信号。
磁带价每GB明显比磁盘便宜,你可以淘宝下看看价格,不同厂家价格差异也不少,有的价格就是光盘每GB的价格。由于廉价,用来存储长期不用的数据最合理。比如大公司几年前的财报,邮件记录重要但是一般不用,就可以存进磁带,而不是占用宝贵的硬盘空间。
磁带机性能肯定不如硬盘的,特别是你要从磁带尾部读取数据,那就要倒带到最后,想想确定数据位置花费的时间吧,而磁盘只需要确定扇区,平均时延十毫秒左右,企业级磁盘更低。
所以磁带库是用来存储大量需要归档保存的数据的绝好设备。多年前还有光盘库,一个道理。
深入想想,如果我们可以把磁盘的盘片装载一个库,然后多个磁盘盘片共用一个盘体,磁头,电路,来工作,一盘片写满,换个盘片。这不就是光盘库的工作过程,这个想象中的 磁盘库 也会很廉价。买磁盘就是买个磁盘的盘片就行。 其实技术上行不通,磁盘读取盘片需要苛刻的封闭的无尘环境,而认为维护磁盘库肯定会破坏这环境的。
举这个例子只是为了让你更明白的体会磁带库,光盘库的工作过程。
天啊 我打了这么多的字~建议采用专业服务器做集群,如IBM、HP,外加盘阵。
集群的好处大家都很清楚,这里不做详细介绍。
盘阵存储配置关键在于RAID,RAID的做法有很多种,简单规总如下(至于选哪种是要根据你自己的情况和机器的情况考虑了):
1 RAID介绍
RAID是Redundent Array of Inexpensive Disks的缩写,直译为“廉价冗余磁盘阵列”,也简称为“磁盘阵列”。后来RAID中的字母I被改作了Independent,RAID就成了“独立冗余磁盘阵列”,但这只是名称的变化,实质性的内容并没有改变。可以把RAID理解成一种使用磁盘驱动器的方法,它将一组磁盘驱动器用某种逻辑方式联系起来,作为逻辑上的一个磁盘驱动器来使用。
11 RAID的优点
111 传输速率高
在部分RAID模式中,可以让很多磁盘驱动器同时传输数据,而这些磁盘驱动器在逻辑上又是一个磁盘驱动器,所以使用RAID可以达到单个的磁盘驱动器几倍的速率。因为CPU的速度增长很快,而磁盘驱动器的数据传输速率无法大幅提高,所以需要有一种方案解决二者之间的矛盾。
112 更高的安全性
相较于普通磁盘驱动器很多RAID模式都提供了多种数据修复功能,当RAID中的某一磁盘驱动器出现严重故障无法使用时,可以通过RAID中的其他磁盘驱动器来恢复此驱动器中的数据,而普通磁盘驱动器无法实现,这是使用RAID的第二个原因。
12 RAID的分类
121 RAID 0
无冗余无校验的磁盘阵列。数据同时分布在各个磁盘上,没有容错能力,读写速度在RAID中最快,但因为任何一个磁盘损坏都会使整个RAID系统失效,所以安全系数反倒比单个的磁盘还要低。一般用在对数据安全要求不高,但对速度要求很高的场合,如:大型游戏、图形图像编辑等。此种RAID模式至少需要2个磁盘,而更多的磁盘则能提供更高效的数据传输。
122 RAID 1
镜象磁盘阵列。每一个磁盘都有一个镜像磁盘,镜像磁盘随时保持与原磁盘的内容一致。RAID1具有最高的安全性,但只有一半的磁盘空间被用来存储数据。主要用在对数据安全性要求很高,而且要求能够快速恢复被损坏的数据的场合。此种RAID模式每组仅需要2个磁盘。
123 RAID 0+1
从其名称上就可以看出,它把RAID0和RAID1技术结合起来,数据除分布在多个磁盘上外,每个磁盘都有其物理镜像盘,提供全冗余能力,允许一个以下磁盘故障,而不影响数据可用性,并具有快速读写能力。但是RAID0+1至少需要4个磁盘才能组建。
124 RAID 5
无独立校验盘的奇偶校验磁盘阵列。同样采用奇偶校验来检查错误,但没有独立的校验盘,而是使用了一种特殊的算法,可以计算出任何一个带区校验块的存放位置。这样就可以确保任何对校验块进行的读写 *** 作都会在所有的RAID磁盘中进行均衡,既提高了系统可靠性也消除了产生瓶颈的可能,对大小数据量的读写都有很好的性能。为了能跨越数组里的所有磁盘来写入数据及校验码信息,RAID 5设定最少需要三个磁盘,因此在这种情况下,会有1/3的磁盘容量会被备份校验码占用而无法使用,当有四个磁盘时,则需要1/4的容量作为备份,才能让最坏情况的发生率降到最低。当磁盘的数目增多时,每个磁盘上被备份校验码占用的磁盘容量就会降低,但是磁盘故障的风险率也同时增加了,一但同时有两个JBOD,JBOD(Just Bundle Of Disks)既简单磁盘捆绑。JBOD是在逻辑上把几个物理磁盘一个接一个串联到一起,从而提供一个大的逻辑磁盘。JBOD上的数据简单的从第一个磁盘开始存储, 当第一个磁盘的存储空间用完后, 再依次从后面的磁盘开始存储数据。JBOD存取性能完全等同于对单一磁盘的存取 *** 作,也不提供数据安全保障。它只是简单的提供一种利用磁盘空间的方法,JBOD的存储容量等于组成JBOD的所有磁盘的容量的总和。
125 Matrix RAID
矩阵磁盘阵列是Intel 新近创立的一种针对SATA接口的专利RAID模式,特点是能在2个磁盘上同时实现RAID 0与RAID 1两种模式,其工作原理是将2个磁盘中的每个磁盘的部分磁盘空间划分出来组成RAID 0或1,而将剩余空间组成RAID1或0。Matrix RAID还有一个功能:支持RAID 1阵列分区的“热备份”硬盘。通常支持Matrix RAID功能的主板具有四个SATA接口,而建立一组Matrix RAID只需要两块硬盘,使用两个SATA接口。另外两个闲置的SATA接口就可以插上硬盘,启动“热备份”功能。当Matrix RAID系统中的一块硬盘出现故障时,“热备份”硬盘便会立刻接替它的工作,以保证RAID 1阵列分区中数据的安全。由于RAID 0阵列分区中的数据在一块硬盘崩溃的时候就已经损毁了,所以“热备份”硬盘对RAID 0阵列是无效的。
*** 作方面,不同的服务器厂家或盘阵厂家都有自己的一套方法或软件。如IBM的SERVER RAID MANAGER 就是典型的阵列配置软件。
1、服务器是按24小时长时间运行机制设计的,稳定性更好,当然价格更贵。
2、关于数据总线,服务器考虑得速度更快一些,一般采用SCIS或SAS。
3、服务器具有RAID功能,支持盘阵。
如果你对做服务器的机器要求不高,一般的PC就可以胜任;反过来,如果拿服务器当PC用,就感觉不搭调了。
1CPU
服务器CPU的指令一般是采用的RISC(精简指令集)。根据研究,在大多数的应用中,CPU仅仅使用了很少的几种命令,于是研究人员就根据这种情况设计了该指令集,运用集中的各种命令组合来实现各种需求。这种设计的好处就是针对性更强,可以根据不同的需求进行专门的优化,处理效更高。相对应的则是 CISC(复杂指令集),他的特点就是尽量把各种常用的功能集成到一块,例如我们常常听到的MMX,SSE,SSE+,3D!NOW!等等都是这种类型的。
另外,服务器的CPU设计一般都要考虑它的多路功能,就是多个CPU一起工作,而PC则一般只一颗CPU。
2内存
内存在服务器上的原则也上越快越大越好,不过它对纠错和稳定提出了更高的要求,比如ECC(“错误检查和纠正“好象没人这么叫的)。我们现在使用的PC上很少有人能够用到1G的内存(玩游戏的不算),而在服务器上,这G级的内存有时也会显着捉襟见肘,记得去年国家发布银河最新超级计算机时,他的内存更是达到了1个 T;相比内存的速度,人们在应用的时候更优先考虑内存的稳定和纠错能力,只有在保证了这两条,才能再考虑别的东西。
3硬盘
硬盘性能无论是在PC上还是服务器上,性能的提升一直很缓慢,个人认为,依靠机械的发展,硬盘的发展是不可能出现质的飞跃。由于使用服务器的一般都是企业单位,里面都是保存了大量珍贵数据,这对硬盘就提出了安全稳定的要求,硬盘上出现的相关技术也基本上围绕这两个要求转。比如:数据冗余备份,热插拔等。另外,服务器硬盘必须能做到247不间断工作的要求。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)