终结硬件时代 SAP谈HANA如何改变IT架构

终结硬件时代 SAP谈HANA如何改变IT架构,第1张

.

最近有一个业务用户提到,他用了整整三天才提取出了正确的月报表数据,并把它们生成新的格式。想象一下,如果把这三天运用在更多的策略制定工作上面,会产生多大的效果。现在已经是2012年了,今后我们都不应该受制于这样的琐事。其实,30年前数据仓库的诞生为的就是解决这个问题。从那以来,数据仓库的构建和维护就与它息息相关。在构建巨型数据仓库多年以后,我们又遇到了新的问题,直接影响着企业对数据的理解,主要与开发速度、业务实现速度和灵活性有关。报表效能的问题一直存在,但通过SAP业务仓库加速(BWA)已经得到了改进。 ● 开发速度在SAP数据仓库中使用传统的分层式可扩展性架构,你能够构建出七层数据。也就是说,在用户看到所需形式之前,你将相同的数据复制了七次。理论上讲,通过HANA ,现在可以把七层降至两到三层。许多用惯了SAPBW的用户都感觉HANA难以上手。然而,就目前来看, HANA改变我们在数据仓库中创建模型的方法是完全有可能的。这对BW开发生态系统来讲无疑是毁灭性的消息,不过SAP建议客户可以将HANA作为BW数据库进行实施。这对保留采购SAP软件的关键特性非常有用,因为有合作伙伴生态系统在支持着它。 ● 实现速度更短的开发周期有相应的后续效应--系统可以比以往更加快速地部署到终端用户。这一点非常重要,因为这为更加灵敏的方法提供了支持。以我的经验来看,灵敏的方法非常适用于业务分析,因为大量终端用户都不熟悉系统性能,对自己的期望也一片茫然。在BI项目中尤为典型,我们需要载入数以万记甚至亿记的记录,而在等待数据上载的过程中开发者就无事可做。一旦有问题出现,开发周期就会失去控制,从而必然导致业务用户受挫和对系统信心的丧失。开发灵敏度还支持SAP的客户革新,这一点我们在Google和Facebook的理念中能够看到, SAP也同样能够做到。 ● 灵活性在SAPHANA中创建数据模型的流程能够重复使用,这意味着通过新的改进,在你的现有提取数据中创建额外报表更加容易。这些美好的憧憬都建立在三个假说之上: 1. 拥有优秀的SQL开发人员; 2. 认证HANA的内存可以无限扩展; 3. 系统集成人员采用更为灵敏的方式。随着这些领域的日臻成熟,我敢保证会有越来越多的企业采用HANA .鉴于业务用户对业务分析会有更高的要求,

必学:1、计算机基础(linux+perl+R 或者 python+matlab)

2、生信基础知识(测序+数据库+数据格式)

3、生信研究领域(全基因组,全转录组,全外显子组,捕获目标区域测序)

4、生信应用领域(肿瘤筛查,产前诊断,流行病学,个性化医疗)

分而治之:

一、计算机基础,需要看三本书,一步步的学会学通,不需要刻意去找哪个书,一般linux是鸟哥私房菜,perl是小骆驼咯,R是R in action,但是看一本书只能入门,真正想成为菜鸟,必须每个要看五本书以上!我云盘里面有这基本上的高清打印版,大家可以去淘宝打印一下才几十块钱还包邮,对书比较讲究的也可以买正版,也不过是一百多块钱而已!

二、生信基础知识,测序方面,在百度文库找十几篇一代二代三代测序仪资料仔细研读,然后去优酷下载各大主流测序仪的动画讲解,再看看陈巍学基因的讲解;数据库先看看三大主流数据库——NCBI,ENSEMBL,UCSC,还有一些也可以了解一些(uniprot,IMGT,KEGG,OMIN,TIGR,GO)同样也是百度文库自己搜索资料,但是这次需要自己去官网一个个页面点击看,一个个翻译成中文理解吃透;数据格式讲起了就多了,这个主要是在项目流程中慢慢学,或者你有机会去上课,不然你看来也是立马忘记的,主要有sam,vcf,fasta,fastq,bed,gtf,gff,genbank,ensembl,psl等等

三、生信研究领域,各个领域主要是软件繁多,合起来常用的估计有上百个软件了,一般只有从业五六年以上的人才有可能把它们全部用过一遍,而且这也完全需要项目来训练,而不能仅仅是看看软件手册,但是研究领域最重要的是背后的原理,需要看各大牛的综述。

a) 生信基础软件(blast++套件,fastqc,flash,blast,solexaQA,NGS-QC-toolkit,SRA-toolkit,fastx-toolkit)

b) snp-calling相关软件(bwa,bowtie,samtools,GATK,VarScan.jar,annovar)

c) 基因组相关软件(velvet,SOAPdenovo2,repeatmasker,repeatscount,piler,orthMCL,inparanoid,clustw,muscle,MAFFT,quickparanoid,blast2go,RAxML,phyML)

d) 转录组相关软件(trinity,tophat,cufflinks,RseQC,RNAseq,GOseq,MISO,RSEM,khmer,screed,trimmomatic,transDecoder,vast-tools,picard-tools,htseq,cuffdiff,edgeR,DEseq,funnet,davidgo,wego,kobas,KEGG,Amigo,go)


欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/sjk/6918366.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-03-30
下一篇 2023-03-30

发表评论

登录后才能评论

评论列表(0条)

保存