string网站怎么导出蛋白连接的表格

string网站怎么导出蛋白连接的表格,第1张

首先打开数据库,会显示出主页如图所示。左侧有输入选项,可以根据你感兴趣单个或多个蛋白的名字,序列去搜索。以蛋白名字为例,输入EGFR蛋白,并且选择数据来源为人。然后点击search搜索即可。

接下来会出现如下图所示的界面,点击continue继续即可。

点击继续后即可出现如下图所示的结果,即为与EGFR存在相互作用的蛋白网络。在相互作用网络下方可以看到有一些选项,包括viewers,legend,settings,analysis,exports等等。

Viewers选项是提供结果呈现的不同形式。

①Network形式就是上图所展示的蛋白相互作用网络。

②Cooccurrence形式视图显示了跨物种连接蛋白的存在或缺失。蛋白质在页面顶部列出,物种名称的系统发育树在左侧列出。在接下来的表格中,一个物种中蛋白质的存在被标记为红色方块,而缺失则被标记为空白。红色方块的颜色强度反映了该物种中同源蛋白的保存量。

③experiments形式显示了从其他蛋白质-蛋白质相互作用数据库中收集的重要蛋白质相互作用数据集的列表。

④coexpression形式显示了在相同或其他物种中共表达的基因(通过同源转移)。共同表达用红色方块表示:方块的颜色越强烈表示表达数据的关联得分越高。

⑤databases形式显示了一个重要的蛋白质相互作用组的列表,收集自精心策划的数据库。

legend部分中,是对蛋白相互作用网络的详细解读。不同颜色的线代表不同的证据强度。预测的关联会立即显示在输入下面的列表中,按分数排序。如果输入基因是两种功能的融合,两者都会显示出来。单击分数符号将显示单个预测方法分数的细目。点击一个基因名称,就会得到蛋白质序列,以及STRING中类似蛋白质的列表。

对于settings选项则是根据自己的需要去设置一些参数,对网络图进行进一步的调节。

Analysis选项是对产生的网络图的进一步分析。将与EGFR存在相互作用的蛋白质进行GO,KEGG富集分析,并且会提供数据来源的文献。

Exports选项可以将生成的数据图导出成PNG,TSV等不同格式。

Cluster选项是可以对相互作用蛋白举行聚类分析。More选项是提供更多的相互作用蛋白,less则是更少。对于生成的相互作用网络而言,点击图中的蛋白球则可以获得关于蛋白的一些信息。例如蛋白的介绍

Genbank库包含了所有已知的核酸序列和蛋白质序列,以及与它们相关的文献著作和生物学注释。它是由美国国立生物技术信息中心(NCBI)建立和维护的。它的数据直接来源于测序工作者提交的序列;由测序中心提交的大量EST序列和其它测序数据;以及与其它数据机构协作交换数据而来。Genbank每天都会与欧洲分子生物学实验室(EMBL)的数据库,和日本的DNA数据库(DDBJ)交换数据,使这三个数据库的数据同步。到1999年8月,Genbank中收集的序列数量达到460万条,34亿个碱基,而且数据增长的速度还在不断加快。Genbank的数据可以从NCBI的FTP服务器上免费下载完整的库,或下载积累的新数据。

NCBI还提供广泛的数据查询、序列相似性搜索以及其它分析服务,用户可以从NCBI的主页上找到这些服务。

直接用相对丰度值进行热图的绘制,常常会由于聚类结果中出现相对丰度值分布不均匀,导致大部分丰度较低的物种呈现相同或相近的颜色,不利于样品及物种间的比较分析,因此需要在绘制之前对数值进行标准化,即对每一个丰度排在前30的物种单独进行z-Score并取自然对数后绘制热图。

现代生物研究中的高通量技术如microarray、蛋白质组学或NGS能够让科学家们检测到几乎所有的mRNA,蛋白质或DNA序列的变异,从而获得成千上万的数据。分析数据结果的复杂程度和所需要的时间也随之直线上升,科学家们往往会陷入如何从海量的实验数据中挖掘到该体系到底发生了什么的泥潭中。想充分挖掘实验数据中的价值,需要科学家多方面的知识和技能,既要从生物学角度去阐释整个实验系统,又要理解系统变化的原因和效应等。科学家们通常只去寻找实验数据中发生差异表达的基因的上游调控子,如转录因子或调控的microRNA。但要完全理解实验结果的效应,科学家们必须进一步分析差异基因所调控的分子通路,生物学功能,已知的毒理学效应并对某些特定的关键分子进行进一步的全面调研(ie 后续靶标或生物标志物)。

以前科学家们可以依赖于个人的生物学专业知识并辅以检索最新文献来进行简单的数据分析。但随着文献的研究领域分类更加细化,知识的积累和文献的调研变得不再那么简单。现在,科学家们开始使用基于互联网的软件工具,包括专业的网站(ie PubMed)和一些的或商业化的分析工具(ie DAVID, Ingenuity-IPA)来帮助收集并分析数据。常规的高通量数据的分析和进一步的实验假设,一般均从阅读尽可能多的相关文献并调研实验结果中变化最大的基因开始。然而这样的分析策略往往会大量遗漏关键的信息,很多时候是因为相关的分子数据库和实验数据相关的文献量非常大,以至于科学家们无法面面俱到。而二代测序(NGS,如RNA-sequencing)的数据相当于为microarray实验提供了更加精确的转录本和同源基因信息,使获得信息变得更加复杂。因此,能够深度挖掘实验数据、将各种来源的背景信息整合在一起并提供灵活易用的工具进行查询的软件对理解实验结果变的日益重要。

虽然 --p-trunc-len 我们指定的是460,但是它会智能的根据引物来截取,最终得到的序列是 430bp 左右

参考:

>

B11=INDEX(1:1,SMALL(IF($B3:$AZ3>0,COLUMN($B$1:$AZ$1),256),COLUMN(A1)))&""

数组公式,同时按CTRL SHIFT 回车键,出现结果,右拉,下拉公式

B15=INDEX(1:1,SMALL(IF($B4:$AZ4>0,COLUMN($B$1:$AZ$1),256),COLUMN(A1)))&""

数组公式,同时按CTRL SHIFT 回车键,出现结果,右拉,下拉公式

以上就是关于string网站怎么导出蛋白连接的表格全部的内容,包括:string网站怎么导出蛋白连接的表格、怎么从genbank下载物种信息并打开、物种相对丰度热图分析中为什么数据结果的表格中没有负值,而图中的图例有负数等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/9335577.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-27
下一篇 2023-04-27

发表评论

登录后才能评论

评论列表(0条)

保存