打开以后,双击安装界面中的“Virtual Boxpkg”开始安装,如图所示
接下来系统会一个安全提示,点击“继续”按钮,如图所示
5
随后再一路点击“继续”按钮就可以了。
6
安装完成以后,在系统的 LanuchPad 中可以找到 Virtual Box 的应用图标,点击打开它,如图所示
7
接下来在 Virtual Box 界面中,点击左上角的“新建”按钮就可以开始创建一个虚拟机了。1、下载好软件后,用解压打开,选择安装文件夹解压,解压后,打开文件夹,选择Nest单击,选择文件夹,确认nest,按照提示选择确认nest继续、系统会提示等待中,最后选择确认finish,完整安装。
2、打开虚拟机,再打开原来的文件夹,把汉化包打开,点击确认下一步,选择文件夹,确认安装,确认完成,对号勾上,点击新建虚拟机,选择标准。下一步,选择需要安装的系统文件,选择默认的设置,下一步选择默认的值,下一步。完成虚拟机建立。从本机中选择打开连接网络,选择本地连接。如果是无线网可以选择无线网。
选择属性,点击共享按钮。
将internet连接共享下面两个选项都选中,然后在家庭网络连接选择VMware Network Adapter VMnet1。
在安装的虚拟机中选择虚拟机->设置选项。
5
点击网络适配器,将网络连接改成仅主机模式(Host-only),然后在右侧选择主机模式,点击确定。熟悉完虚拟机配置服务器之后,就可以尝试上手搭建实体服务器了,如果要选购服务器,应该考虑哪些因素呢?如果不差钱,那就好办了,直接选最贵的就好了。在预算有限的条件下。CPU,内存,硬盘如何取舍,达到最佳性能,是否需要购买UPS,显卡是否有必要?这些问题,我们一文解决这些疑问。
二十二:服务器配置
1、CPU
CPU是计算机的大脑,计算机的计算主要就是靠CPU来完成,所以,CPU非常重要,CPU的计算速度决定了计算机的计算能力。也就是水桶效应中最上面的那块木板。比如序列拼接这个工作,需要将测序的reads切成更小 的片段,然后将这些小片段根据序列间的关系,连成更长的片段,那么这些片段有数百万至数千万,需要非常大的计算量。如果数据复杂,计算量就更大了。
另外,CPU还需要支持多核心,CPU是大脑,一个核心是一个心眼儿,所以,我们知道心眼越多的人越聪明。多核心就可以进行并行计算,在生物信息分析中,有些工作,可以进行并行计算。相当于原来一个人的工作,现在由100个同样的人来做,理论上速度快了100倍。因此,在硬件配置中,选择CPU是非常重要的。
2、内存
内存是CPU和硬盘之间数据交流的媒介,计算机需要将存储在硬盘上的数据读取到内存中,CPU才能用来计算,而CPU不能直接读取硬盘上的数据,必须通过内存这个缓冲区,举个例子,CPU是大脑,内存是脖子,脖子以下是硬盘。内存往往就是“瓶颈”。
假设一个人的全基因组测序数据,采用二代测序的方法,人的基因组3G,10被数据30G,那么这30G的碱基,在切成更小的kmer,假设数据增加到了100G,还不算存储序列的一些其他信息,序列拼接的时候必须一次将所有数据同时存入内存,如果内存达不到100G,拼接根本无法完成。
3、硬盘
硬盘其实是计算机硬件配置中非常重要的一环,但是硬盘往往容易被大家忽略掉,认为硬盘用来存储数据,只要需要足够大就行了,这是不对的。
首先大存储量是必须的,因为生物数据往往都称为生物大数据,非常消耗存储空间,包括原始的数据存储,中间分析结果,最终结果,数据备份等,尤其是在样品量大的时候,就会非常占据存储空间,一般都是以T为单位的。
其次,硬盘的读写速度,这个也是非常重要的因素,因为目前CPU计算速度和内存已经足够大了,这样的条件下,硬盘成为限制计算机整体性能的因素。因此使用SSD硬盘会明显改善计算机性能。由于目前SSD过于昂贵,可以选择SSD+机械硬盘的方案,硬盘要做成RAID提高读写速度和数据安全性。
4、显卡
可以选配显卡,这个并不是必须的,因为很多分析工作都是文本 *** 作,显卡适合于图形计算,例如计算蛋白质空间结构,构建系统网络等,可以选择配置显卡。
5、不间断电源UPS
UPS相当于一个大的移动电源,为了防止突然断电,导致数据丢失。UPS还是非常重要的。有些生物计算需要持续很长时间,例如拼接一个大的基因组,构建一个大的系统发育树等可能数十天时间,一旦断电,损失非常大,不要心存侥幸心理,灾难往往就发生在那些心存侥幸心理的人身上。
6、其他
冷却系统,如果是大型计算系统,设备会产生大量热量,需要建设冷却系统。
---------- END ----------
欢迎订阅我们的微信公众号,更多精彩内容等你发掘!Apache 就内置在 Mac OS X Server 中,它是互联网上使用范围最广的 >
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)