你这个问题太宽泛了,不太好回答,先大概讲一下吧,如果有其他问题,可以私信沟通。
计算机从10台增加到100台,首先应该考虑增加主域控制器,相信我,有域的网络环境,才是标准的企业网络架构,管理很方便;
其次,建议搭建文件服务器,根据域帐户、工作组来配置相应的读写权限,不但是提高工作效率,也是及时备份工作文件的一种方法;
第三,建立使用ERP服务器和OA服务器,使公司管理更上一层楼。
第四,必须配置至少一台备份服务器,毕竟硬件有价,数据无价嘛。有条件的话,可以加配磁带备份机。
至于服务器的选择,笔者建议选择戴尔服务器,特点:价廉物美@戴尔;或者支持一下国产,用华为服务器:稳定可靠。@华为
另外,服务器虚拟化是必须的,否则上面提到的那些角色,每个角色一台物理服务器话,那就太浪费了。
摘要: Manta软件可以从比对文件中检测SVs和indels。它主要开发用于检测单个样品的germline变异和tumor/normal配对样品的somatic变异。它可以在一套流程中高效的发现、组装、打分大范围的SVs,中型indels和大型insertions。该软件主要用于标准计算硬件上进行快速的分析:NA12878细胞系50x覆盖基因组可以在20核服务器上20分钟分析完毕,大多数WGS tumor/normal配对样品可以在2个小时内分析完毕。在SV的检测和打分过程中,Manta结合paired-read和split-read来提高准确性,但是在有其他有力证据的情况下,不需要利用split-read或者断点组装来报告融合。Manta通过连续组装的方法可以使分辨率达到碱基级别,更有利于下游的注释和临床意义分析。Manta软件接受输入BAM或CRAM格式文件,并以VCF41的格式报告所有的SV和indels突变。引言: 目前许多前进的结构变异检测方法都集中在科学研究和群体基因组上。然而,目前还没有一个流程专注于快速检测单个或者成组样本的多种类型变异。Manta软件主要专注于临床领域,可以根据输入的比对文件和基因组文件,迅速对变异进行发现、组装、打分。它可以对二倍体的germline类型变异,tumor/normal配对的somatic变异进行检测,而RNA-Seq分析,de novo变异分析,不配对的tumor样品变异分析应用还在开发中。在与其他代表型的工具的比较中,Manta软件可以在显著降低计算成本的情况下,高质量的检测变异。
方法:
流程汇总 : Manta流程设计用于高并行的检测单个或成组的样品。它运行包括两个阶段:1、首先建立基因组内所有断裂关联图表,2、对图表中的组成部分进行处理,包括备选假设变异的生成、组装、打分以及VCF文件的报出。断点关联图表包括了任意基因组区域内远距离相关的边界,和indel组装区域的自边界。由于这个图表不含具体的假设变异,所以它非常的紧凑,可以在基因组范围内进行大片段的重构。在图表重构后,单独的边界(应该是相关的变异)用于后续变异的分析。每个边界都被分析,用于寻找不精确的假设变异,每个变异reads都会被组装并重新比对到基因组上。每个变异都会尝试进行组装,但是组装不是报告一个变异的必须步骤。在先前的germline和somatic变异模型下,所有paired-read和split-read的证据会被整合成一个质量分数,相应的过滤指标也会补充这个质量分数,以提高变异变异检测的精度。为了便于应用,Manta会自动评估插入片段的大小分布排除基因组中高重复区域。
变异检测评估: 在CEPH 谱系 1463上评估了变异软件的germline检出能力。为了获得一致的变异检出结果并提供软件之间的recall比较,选择了公认标准的软件进行变异检测并比较。选择Pindel用于检测indels,选择Delly用于检测SVs。每种检测软件检出的变异与Manta检测出的变异会建立pedigree变异一致数据集,用于软件的精度的比较,选择的数据集是NA12878细胞系。Delly软件也被当做是检测somtaitc变异的基准软件,比较了它与Manta在乳腺癌细胞系HCC1954上的检出能力。
Recall = 召回率,评估的是灵敏度
Precision = 精确率,评估的是特异性
结果: 表1 结果 从NA12878细胞系的SVs(大片段的缺失和重复)检测结果来看,Manta具有较高的召回率。从NA12878细胞系的Indels检测结果来看,相对于500bp一下的小的插入缺失,大的插入缺失Manta软件的召回率优势更为明显。从HCC1954观测到Manta软件在所有变异类型中都具有强大的性能,并且所有类型中组装到basepair分辨率的比例都很高。
表2结果:通过运行时间或者内存度量,Manta软件在提供更多种类变异类型检测时,具有更低的计算消耗和计算时间。
Manta软件详细的变异检测算法原理稍后补充
参考文献:
Xiaoyu C , Ole S T , Richard S , et al Manta: rapid detection of structural variants and indels for germline and cancer sequencing applications[J] Bioinformatics, 2016(8):1220-1222
建议选择云服务器。
为什么呢?
虚拟主机权限约束太大,独立服务器成本又吃不消,选择云服务器部署自己的业务,算是相对比较优秀的选择了。
接下来看看那如何选择云服务器
第一步,选择品牌
现在主流的云服务器提供商有阿里云、腾讯云、华为云、百度云、天翼云、金山云。
斜阳在这里主要推荐阿里和、腾讯云。
理由:1,产品性能有保障,毕竟云服务器,最怕的就是宕机和数据丢失,这两家应该算是做得最久的,用户人群也是最大的。
2,相关配套的社区教程更多一些。对于新手来说,有教程,有一键安装的软件,有安装好的环境,有人能咨询是非常重要的。
第二步,地域节点
选好品牌之后,就需要考虑用户在哪里。毕竟云服务器离用户越近,用户的访问速度越快,访问质量越高。
举例:如果你的目标用户聚集在青岛,那么你就可以选择青岛的节点。如果你的用户分散在全国各地,那这一步就随意了,反正你得考虑上CDN等其它方式来加快用户的访问速度。
如果你的用户主要在国外,就得选择国外的香港或者海外的服务器了。(如果不想备案也可以这些地方)
第三步,规格或者实例
其实就是cpu,内存这些东西。对于新手来说,斜阳我建议就买一个入门级的,如果后面的系统想用windows系统做服务器的,最低应该用2核4G,不然可能window系统装不上,那就有点尴尬;如果后期想用linux系统的,1核2G也够用。
因为云服务器有一个特性,这些性能都是只能升级不能降级的。所以新手先尝试用低级的,后面发现什么性能吃紧了,再升级也来得及。当然如果是土豪,那就随意啦。
第四步,镜像或者系统
这时候就轮到,选系统了。主要分为window和linux。这里没有特别需要嘱咐的,主要这个需要按照业务需求来。
而且选错也不要紧,只要重启服务器,重新换镜像就可以了,这一步可以随意。
例如阿里云或者腾讯云其实会有一些配置好环境的镜像,如果不会或者不想自己搭建环境也可以直接用配置好的镜像。
第五步,磁盘和网络
这网络是真的不太重要,不需要特意配置,默认就行了。
磁盘这里有一点要注意一下,虽然服务器自带40G硬盘,但是例如阿里云会把这40G全用作系统盘,如果系统蹦了,或者出现其他问题。这里面的数据就没了。所以磁盘必须要买一个,买一个最小的数据盘就行,避免出现那种数据丢失的尴尬处境。
第六步,带宽
带宽是分为两种的,第一种是固定带宽,简单来说就是交年费,无论多少流量,都是固定年费。
第二种是d性带宽,简单来说就像交手机的流量费,你用了多少,就交多少。
新手建议用d性带宽,毕竟前期基本上都是自己摸索采坑用的,没有太大的流量。
带宽的大小,可以参考下面举得例子。
差不多是这么一个数量级,对于一个的普通的网站来说,1M带宽大概能承受1000IP的访问,这个要除去高并发的情况。
如果这个网站绝大部分都是或者其他资源,那么最大能承受的IP至少要除以10。
斜阳说
我相信看完这边文章,基本上就没问题了吧!
1、首先,应该检查网络环境,确保网络稳定,带宽足够,网络延迟小,确保网络环境良好;2、其次,应该检查服务器的配置,确保服务器的CPU、内存、硬盘等资源充足,以及服务器的 *** 作系统是否是最新版本;
3、再次,应该检查数据库服务器的配置,确保数据库服务器的CPU、内存、硬盘等资源充足,以及数据库服务器的 *** 作系统是否是最新版本;
4、最后,应该检查数据库的配置,确保数据库的索引、字段类型、字段长度等设置正确,以及数据库的优化是否正确,以及数据库的 *** 作是否正确,以及数据库的查询是否正确。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)