转录组定量工具-featureCounts安装及使用

转录组定量工具-featureCounts安装及使用,第1张

        计算表达量可以用 StringTie、Htseq-count或featureCount ,第一次做转录组分析时,参照了一篇Cell的子刊文章的分析方法,里面使用的STAR+featureCount,就直接用了这个软件,也就没再使用别的,回头看第一次使用时,发现好多细节没有注意到,温故而知新。featureCount是subread软件包里的一个命令,所以安装subread即可。而subread又有命令行版和R版,有服务器,自然选择命令行版了。

featureCounts ,有两个核心概念:

       Feature: 指的是基因组区间的最小单位,比如exon;

       Metafeature: 可以看做是许多的feature构成的区间,比如属于同一个gene的外显子的组合。

       在定量的时候,支持对单个feature 定量(对外显子定量), 也支持对meta-feature进行定量(对基因进行定量)。当reads比对到2个或者以上的features 时,默认情况下,featureCounts在统计时会忽略到这部分reads, 如果你想要统计上这部分reads,可以添加-O 参数,此时一条reads 比对到多个feature,每个feature 定量时,都会加1。对于meta-features来说,如果比对到多个features 属于同一个 meta-features(比如一条reads比对到了exon, 但这些exon属于同一个gene), 则对于这个gene 而言,只会计数1次。 总之,不管对于 feature 还是 meta-feature, 只有比对多个不同的区间时,才会分别计数。

  首先是官方网站

        >

2311 分布式数据源技术

所谓分布式数据源是相对于单一集中数据源提出的,在以往网络程序开发中,一般都是采用单一数据源,程序和数据库是部署在一台机器上或局域网内的不同机器上,相当于一个程序对应一个数据接口。但在现代的网络应用中,产生了新的需求,例如,网上送货,送货单位为了查询客户需要的产品,他们可能自己建立了商品信息数据库,以其应用程序在自己的数据库中检索,同时又想利用其他相同性质公司的数据库。如何使一个程序能跨过局域网去访问其他公司的数据库就成了技术难题,由于相似的种种应用,从而产生了分布式数据源技术。

分布式数据源技术可在不同地点、不同单位、不同的服务器发布数据,通过相应的网络协议和安全验证机制,使有权限的用户通过他们的程序利用这些网上分布的数据源的一种技术。

在 GIS 领域,由于地理信息的本质特征是区域分布性,具有明显的地理参考系统。可以根据行政区划、自然地理区域等来组织地理数据。采集、管理和维护这些不同区域的数据并没有因果从属关系,而是相对独立和平行的。因此,高效的系统应该是当地数据的采集、管理、存储由当地完成,但各部门都可以在网络上各个节点调用其他区域的数据(欧阳,2004)。由于地理信息的空间分布特征,地理数据库的分布和更新也应该是分布式的。这就需要现在的 GIS 软件系统可以建立分布式的 GIS 数据源,供远程的用户访问。

2312 分布式数据源类型

随着网络技术的发展和 WebGIS 应用的普及,现在网上发布的分布式 GIS 数据源越来越多,大致归纳为以下几种类型: 基于文件形式的数据源、基于空间数据库的数据源和基于 Web 服务方式的数据源。

23121 基于文件形式的数据源

基于文件形式的 GIS 数据源一般都是以 XML(可扩展标识语言)为基础的纯文本文件形式的地理数据,利用这些文件可以存储和发布各种特征的地理信息,并控制地理信息在 Web 浏览器或其他特定浏览器中的显示,这种形式的数据有利于网络传输,并且由于XML 的可扩展性,使得此种形式的数据文件的扩展性良好。此种形式的文件包括 GML、KML 等数据文件类型。其中 GML(Geography Markup Language)即地理标识语言,它由OGC(开放式地理信息系统协会)于 1999 年提出,并得到了许多公司的大力支持,如Oracle、Galdos、MapInfo、CubeWerx 等。GML 的特点(卢娟,2004; 于雪芹,2005):

(1)封装的地理数据和图形解释是清楚分离的;

(2)GML 基于文本表示地理信息;

(3)GML 封装了地理信息及其属性;

(4)GML 封装了空间地理参考系统;

(5)GML 可以实现地理数据的分布式存储 。

GML 作为一个 “开放的” 标准,并没有强制采用它的用户使用确定的 XML 标识,而是提供了一套基本的几何对象 tag、公共的数据模型,以及采用自建和共享应用 Schema 的机制。所有兼容 GML 的系统,必须使用 GML 提供的几何地物 tag 来表示地物特征的几何属性,但可以通过限制、扩展等机制来创建自己的应用 Schema。

而 KML 数据,是 Keyhole Markup Language,是一个基于 XML 语法和文件格式的文件形式 GIS 数据源,用来描述和保存地理信息如点、线、图像、多边形和模型等,可以被Google Earth 和 Google Maps 识别并显示。可以使用 KML 来与其他 Google Earth 或 GoogleMaps 用户分享地标与信息。Google Earth 和 Google Maps 处理 KML 文件的方式与网页浏览器处理 HTML 和 XML 文件的方式类似。像 HTML 一样,KML 使用包含名称、属性的标签(tag)来确定显示方式。

随着 Google Earth 的发展,KML 被更多的浏览器所支持,如微软的 Virtual Earth 支持基本的 KML 和 KML 搜索,ArcGlobe 也开始支持 KML 的浏览显示,ArcGIS Server 支持KML 服务的发布。另外,为了支持 KML 的开发,Google 还开发了一个函数库供用户使用,更加扩大了 KML 作为地理信息共享数据的前景。

KML 提供以下功能:

(1)指定一个地点的图标和标注来区分每一个地点;

(2)为每一个视图指定明确的视角来创建不同的特写镜头;

(3)使用指定到屏幕或地理位置的标注;

(4)为特定种类的标注定义显示样式;

(5)为标注指定基于简单 HTML 语法的描述,支持超级链接和的显示;

(6)使用目录对标注进行树形的分类管理;

(7)基于时间戳记的标注可以用来进行动态的播放;

(8)从本地或远程的网络地址动态的加载 KML 文件;

(9)当 Google Earth 客户端视图变化时,自动将视图信息发送给指定的源服务器并从服务器获取相关的标注信息。表 21 是 KML 文件的示例。

表 21 KML 文件的示例

23122 基于分布式空间数据库的数据源

分布式空间数据库是计算机网络把面向物理上分散,而管理和控制又需要不同程度集中的空间数据库连接起来,共同组成一个统一的数据库的空间数据管理系统。可以简单地把分布式空间数据库看成是空间数据库 + 计算机网络(易晓峰,2005)。它是把物理上分散的空间数据库组织成为一个逻辑上统一的空间数据库系统; 同时,又保持了单个物理空间数据库的自治性。分布式空间数据库中的数据分布在网络中不同节点的数据库中,各个节点具有对本节点数据的最高控制权限,可以使用本地节点数据执行局部应用; 同时,各个节点又接受分布式空间数据库管理系统的统一控制。分布式空间数据库的用户具有不同的权限级别,根据权限级别,各个用户利用分布式空间数据库中的数据可以执行不同的全局应用。

可以将分布式的空间数据库作为数据源在网络上发布供用户使用,这样的数据源服务ArcGIS Server 已经提供,可将 ESRI 的 GeoDataBase 发布到网络上,由用户来访问。这种数据源的应用不如基于文件和基于 Web 服务的方式方便,因为一般的数据库系统都会有很复杂的安全性管理和访问权限的管理,不会让一般的 Web 用户随便的访问,只是面向具体的单位应用。

23123 基于 Web 服务方式的数据源

基于 Web 服务方式的数据源的产生和发展,来源于两方面技术的推动,一是计算机软件领域中 Web 服务技术的出现与发展,二是网络地理空间信息应用方面的发展(陈荦,2005)。

Web 服务是一种部署在 Web 上的组件对象,以支持 Web 上的分布式应用。它通过一系列标准的协议来构建对象间通信机制,关注的是对象显露出来的属性、方法及其调用方式,而不定义对象具体的实现细节与支持环境。

在地理空间信息的网络应用方面,众多网络地理空间信息系统采用了不同的数据框架、运行平台和开发维护方法,这使得它们之间的数据共享和功能性互 *** 作难以施行,同时引起了与网络地理空间信息系统进一步发展的严重矛盾。

Web 服务的突出优点使之适合于解决地理空间信息共享和互 *** 作方面的矛盾。为此,国际标准化组织地理信息技术委员会(ISO/TC211)和开放地理信息联合会(OGC)开始致力于研究基于 Web 服务体系架构的网络地理空间信息服务技术与标准规范,构成网络上分布的 Web 空间数据服务数据源。OGC 推出的三种标准的基于 Web 服务的空间数据服务是 WMS、WFS、WCS。

其中 WMS 数据源服务,是一种客户端请求地图图像的方式和标准,它利用具有地理空间位置信息的数据制作地图。WMS 返回的不是地图数据,而是地图图像(黄向等,2007)。WMS 服务定义了三个 *** 作:

(1)GetCapabilities: 返回服务元数据,服务元数据必须是能被用户或机器识别的,采用 XML 文件表示,是对服务信息内容和请求参数的一种描述。

(2)GetMap: 返回一幅具有正确的地理空间和维数参数的地图图像,图像可以是GIF、JPEG、PNG 格式。

(3)GetFeaturelnfo: 根据用户所请求的 X、Y 坐标或感兴趣的图层,返回地图上某些特征的信息。

在 WMS 的三个 *** 作中,GetCapabilities 和 GetMap 是必须要实现的,而 GetFeaturelnfo是可选的。

下面介绍这三种 *** 作的具体实现过程:

用户使用普通的浏览器(如 IE)或定制的应用系统通过 >

2313 WFS 数据源服务

WFS 服务提供了在 Web 环境下使用 >

WFS 分为两个级别: 基本 WFS 和事务 WFS。基本 WFS 的用户不能修改服务端地理数据源的数据; 事务 WFS 允许用户创建、更新和删除远程数据源的特征数据。

WFS 定义了 5 个 *** 作:

(1)GetCapabilities: 返回服务元数据。元数据必须描述服务所能支持的数据类型和每个数据所能支持的 *** 作。

(2)DescribeFeatureType: 描述服务支持的所有特征数据的类型结构。

(3)GetFeature: 根据请求返回特征数据实例。

(4)Transaction: 事务 WFS 支持这个 *** 作。用于修改特征,包括对地理特征的创建、更新和删除。

(5)LockFeature: 事务 WFS 支持这个 *** 作。用于在连续事务处理期间,锁定特定的要素或要素集。

上述5 个 *** 作的工作流程为: 用户首先发出 GetCapabilities 请求,服务端返回 WFS 服务级别描述、所有命名空间的数据源及其特征类型(图层)列表和相关的坐标系、支持的 Filter 运算集和事务 *** 作等信息; 然后用户选择某种特征类型,发出 DescribeFeature-Type 请求,获取此特征类型的 GML 应用 Schema,该 Schema 包含此特征引用和扩展的GML Schema 和所有属性的几何与非几何的类型描述; 最后用户再发送 GetFeature 请求获得符合该 Schema 的 GML 特征实例数据。同时也可发送 Transaction 或者 LockFeature 请求来 *** 纵特征数据(马庆等,2006; 程飞,2007)。

2314 WCS 数据源服务

WCS 服务 面 向 空 间 影 像数据,它 将 包 含 地 理 位置 值 的地 理 空 间数据 作 为 “覆盖(Coverage)”在网上相互交换。Covergae 是代表空间变化和时间变化的地理空间数据类型,例如遥感影像、DEM 数据等。WCS 服务提供详细而丰富的地理空间信息,客户端可以展示和描绘这些信息,也可以应用这些数据作为科学模型和其他客户端的输入数据。

2315 WMS、WFS、WCS 的区别

WCS、WMS 和 WFS 相同的地方是,都允许客户端选择某一部分服务器上的基于空间约束和其他标准的数据。WCS 与 WMS 不同的是,WMS 通过过滤空间数据,返回的是静态的地图(它们在服务器上以形式存放),类似对数据进行一次快照,而 WCS 提供真正的空间数据以及这些数据详细的描述,允许对这些数据进行复杂的查询,返回的是带有原始语义的数据,这些数据能够被解译、推广,而不仅仅是一次数据的快照; WCS 与WFS 不同的是,WFS 返回离散的地理空间特征(矢量数据),而 WCS 返回的是连续的代表时空变化数据(可能是多维)的一系列空间特征(栅格数据)。

除了这些标准的 Web 服务方式的 GIS 数据源之外,各个商用软件厂商业推出了自己的符合 Web 服务标准的 Web 数据源,如 ESRI 的 ArcGIS Server 和 ArcIMS 的 Map Service、SuperMap 公司的 SuperMap Web Service 等。

2316 数据服务需求

网格环境下,海洋空间数据的组织管理与传统方式的海洋数据的组织管理是不同的,基于网格环境的数据组织管理更强调一体化,或者说数据组织管理的协同性,目标是建立海洋数据的虚拟的单一系统映射,使得用户能够透过门户网站透明地访问所有的共享数据,而不需要在千百万个网站上搜索自己想要的海洋数据。

如果您创建的是GPU虚拟化实例,则需要安装GRID驱动。由于GPU实例配备的NVIDIA GPU计算卡尚未激活NVIDIA GRID License,GPU图形功能受到限制,您需要购买并激活GRID License。本文以Ubuntu 1604 64-bit *** 作系统的GPU虚拟化型实例vgn6i和vgn5i为例,介绍如何安装GRID驱动和激活GRID License,并验证图形化加速效果。
前提条件
创建一台vgn6i或vgn5i实例,确保实例可以访问公网,建议您选择公共镜像中的镜像。
说明 本文介绍如何为运行Linux *** 作系统的实例安装GRID驱动,对需要运行Windows *** 作系统的实例,在创建实例时选用预装GRID驱动的付费镜像即可。具体 *** 作,请参见创建配备GRID驱动的GPU实例(Windows)。
在本地机器上安装了远程连接工具,例如VNC Viewer。
已经通过提交工单获取了GRID License及对应的GRID驱动安装包。
说明 由于GRID驱动的版本必须与您的GPU实例规格及实例所在地域相匹配,因此,请在提交工单时,提供您的GPU实例规格及实例所在地域。
背景信息
本文介绍如何为配备vGPU的GPU虚拟化型实例安装GRID驱动,如果您使用的是Linux *** 作系统的GPU计算型实例,建议您安装GPU驱动即可。具体 *** 作,请参见在GPU计算型实例中安装GPU驱动(Linux)。
安装GRID驱动
禁用nouveau。
nouveau是部分Linux系统中预装的一款开源驱动,必须禁用nouveau才能成功安装新的驱动。
远程连接实例。
选择以下任一种方式远程连接GPU实例。
连接方式 *** 作指引
Workbench 通过密码或密钥认证登录Linux实例
VNC 通过密码认证登录Linux实例
查看是否存在blacklist-nouveauconf文件。
ls /etc/modprobed/blacklist-nouveauconf
如果不存在,请执行以下命令创建该文件。
vim /etc/modprobed/blacklist-nouveauconf
在blacklist-nouveauconf文件中,添加以下内容禁用nouveau。
说明 如果已配置以下内容,则跳过本步骤。
blacklist nouveau
blacklist lbm-nouveau
options nouveau modeset=0
生成kernel initramfs。
说明 如果您在运行如下命令时遇到安装失败等其他问题,请您提交工单获取帮助。
rmmod nouveau
update-initramfs -u
重启实例。
reboot
安装已获取的GRID驱动。
vgn5i
chmod +x NVIDIA-Linux-x86_64-41822600-gridrun
/NVIDIA-Linux-x86_64-41822600-gridrun
vgn6i
chmod +x NVIDIA-Linux-x86_64-43063-gridrun
/NVIDIA-Linux-x86_64-43063-gridrun
vgn6i-vws、vgn7i-vws
chmod +x NVIDIA-Linux-x86_64-4609103-gridrun
/NVIDIA-Linux-x86_64-4609103-gridrun
测试GRID驱动是否安装成功。
nvidia-smi
如果返回以下GRID驱动信息,说明驱动安装成功。其中,Driver Version代表当前GRID驱动版本,CUDA Version代表驱动支持的最高CUDA版本。其他驱动版本及其支持的CUDA版本情况,如下表所示:
GRID驱动版本 支持的CUDA最高版本
43099 101
4609103 112
4708201 114
添加License服务器。
切换到/etc/nvidia目录。
cd /etc/nvidia
创建griddconf文件。
cp griddconftemplate griddconf
在griddconf文件中添加License服务器的信息。
ServerAddress=<License服务器的IP>
ServerPort=<License服务器的端口(默认为7070)>
FeatureType=1
重启实例使License服务器配置生效。
reboot
查看License是否激活成功。
远程连接实例。
查看License状态。
systemctl status nvidia-gridd
返回结果显示License acquired successfully,表示License激活成功。

Windows2008R2安装framework 35的方法工具/原料
Windows2008R2系统服务器一台
远程桌面链接软件(系统自带即可)
方法/步骤
1
在“服务器管理器”选项中选择“增加功能”选项。用户可以看到一个服务器 *** 作系统自身所提供安装的其他软件项目。
2
在“选择功能”框中,选择扩展项“NET Framework 351 Features”
3
用户可以看到两个选项:“for NET Framework 351”选项和“WCF Activation”选项。选择“for NET Framework 351”点击“下一步”
4
在“确认安装选项”栏目中确认“NET Framework 351 Features”已经选取,点击“安装”
5
按照安装向导,一步步的安装“NET Framework 351 Features”即可。
END
方式B:使用PowerShell安装
在服务器用户界面左下方点击“开始”
选择“所有程序”后,在子菜单中选择“附件”
3
选择并打开“Windows PowerShell”,选择“按管理员身份进入(Run as administrator)” ,选择“确定”
4
进入PowerShell命令符界面。并在该命令符界面中输入下列两行程序: Import-Module ServerManager Add-WindowsFeature as-net-framework 在键盘上,按下“ENTER”进入“NET Framework 351 Features”安装过程即可。
END
注意事项
Windows2008R2安装framework 35方法与之前系统相差较大,请仔细阅读后再安装


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zz/13449759.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-08-08
下一篇 2023-08-08

发表评论

登录后才能评论

评论列表(0条)

保存