标准化的方法就是Counts值:
对给定的基因组参考区域,计算比对上的read数,又称为raw count(RC)。
aw count作为原始的read计数矩阵是一个绝对值,而绝对值的特点是基因长度、测序深度不同不可以比较。所以我们要进行标准化把count矩阵转变为相对值,去除基因长度、测序深度的影响,我们采用分析的。
标准化的三种方法得出的三种值:
RPM (Reads per million mapped reads):RPM方法:10^6标准化了测序深度的影响,但没有考虑转录本的长度的影响。
RPKM/FPKM方法:
103标准化了基因长度的影响,106标准化了测序深度的影响。TCGA的数据分析多采用这种结果。
TPM (Transcript per million):TPM的计算方法也同RPKM/FPKM类似,TPM可以看作是RPKM/FPKM值的百分比。
具体判断方法:
表达量是否需要重新标准化。
可以通过boxplot函数观察一下样本表达丰度值的分布是否整齐进行判断。
是否需要log2:根据数据值的大小。
如果表达丰度的数值在50以内,通常是经过log2转化的。如果数字在几百几千,则是未经转化的。
为确保系统各数据库与各功能模块之间的数据分类、编码及数据文件命名的系统性和唯一性,满足系统正常高效运行以及与其他相关系统协同运作的要求,实现系统之间相互兼容、信息共享,数据库建设时必须遵循有关的标准规范。需参照的标准规范如下:
GB/T2260—98 中华人民共和国行政区划代码
GB/T2808—81 全数字式日期表示法
GB/T9649—88 地质矿产术语分类代码
GB/T13923—92 国土基础信息数据分类代码
DZ/T0001—91 区域地质调查总则(1:50000)
DZ/T0157—95 1:50000地质图地理底图编绘规范
DZ/T0160—95 1:200000地质图地理底图编绘规范及图式
DDB9702 GIS图层描述数据内容标准
地质图空间数据库建设工作指南 中国地质调查局
DDZ9701 资源评价工作中地理信息系统工作细则
DZ/T 0179—1997 地质图用色标准及用色原则
DD2005—01 多目标区域地球化学调查规范(1:25万)中国地质调查局
DD2005—02 区域生态地球化学评价技术要求 中国地质调查局
DD2005—03 生态地球化学评价样品分析技术要求 中国地质调查局
GB/T17296—2000 中国土壤分类与代码
GB/T13989—92 国家基本比例尺地形图分幅编号
DZ/T0167—1995 区域地球化学勘查规范(1:200000)
GB/T18507—2001 城镇土地分等定级规程
GB/T17296—2000 中国土壤分类代码
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)