geo数据库数据如何标准化

geo数据库数据如何标准化,第1张

标准化的方法就是Counts值:

对给定的基因组参考区域,计算比对上的read数,又称为raw count(RC)。

aw count作为原始的read计数矩阵是一个绝对值,而绝对值的特点是基因长度、测序深度不同不可以比较。所以我们要进行标准化把count矩阵转变为相对值,去除基因长度、测序深度的影响,我们采用分析的。

标准化的三种方法得出的三种值:

RPM (Reads per million mapped reads):RPM方法:10^6标准化了测序深度的影响,但没有考虑转录本的长度的影响。

RPKM/FPKM方法:

103标准化了基因长度的影响,106标准化了测序深度的影响。TCGA的数据分析多采用这种结果。

TPM (Transcript per million):TPM的计算方法也同RPKM/FPKM类似,TPM可以看作是RPKM/FPKM值的百分比。

具体判断方法:

表达量是否需要重新标准化。

可以通过boxplot函数观察一下样本表达丰度值的分布是否整齐进行判断。

是否需要log2:根据数据值的大小。

如果表达丰度的数值在50以内,通常是经过log2转化的。如果数字在几百几千,则是未经转化的。

为确保系统各数据库与各功能模块之间的数据分类、编码及数据文件命名的系统性和唯一性,满足系统正常高效运行以及与其他相关系统协同运作的要求,实现系统之间相互兼容、信息共享,数据库建设时必须遵循有关的标准规范。需参照的标准规范如下:

GB/T2260—98 中华人民共和国行政区划代码

GB/T2808—81 全数字式日期表示法

GB/T9649—88 地质矿产术语分类代码

GB/T13923—92 国土基础信息数据分类代码

DZ/T0001—91 区域地质调查总则(1:50000)

DZ/T0157—95 1:50000地质图地理底图编绘规范

DZ/T0160—95 1:200000地质图地理底图编绘规范及图式

DDB9702 GIS图层描述数据内容标准

地质图空间数据库建设工作指南 中国地质调查局

DDZ9701 资源评价工作中地理信息系统工作细则

DZ/T 0179—1997 地质图用色标准及用色原则

DD2005—01 多目标区域地球化学调查规范(1:25万)中国地质调查局

DD2005—02 区域生态地球化学评价技术要求 中国地质调查局

DD2005—03 生态地球化学评价样品分析技术要求 中国地质调查局

GB/T17296—2000 中国土壤分类与代码

GB/T13989—92 国家基本比例尺地形图分幅编号

DZ/T0167—1995 区域地球化学勘查规范(1:200000)

GB/T18507—2001 城镇土地分等定级规程

GB/T17296—2000 中国土壤分类代码


欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/sjk/6701434.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-03-27
下一篇 2023-03-27

发表评论

登录后才能评论

评论列表(0条)

保存