吉布斯抽样是什么

吉布斯抽样是什么,第1张

吉布斯采样是生成马尔科夫链的一种方法,生成的马尔科夫链可以用来做蒙特卡洛仿真,从而求得一个较复杂的多元分布。

吉布斯采样的具体做法:假设有一个k维的随机向量,现想要构造一条有n个样本的k维向量(n样本马尔科夫序列),那么(随机)初始化一个k维向量,然后固定这个向量其中的k-1个元素,抽取剩下的那个元素(生成给定后验的随机数),这样循环k次,就把整个向量更新了一遍,也就是生成了一个新的样本,把这个整体重复n次就得到了一条马尔科夫链。

地址: https://www.sciencedirect.com/science/article/abs/pii/S0044848618322336

阅读人:刘绵宇

携带PIRA和PirB有毒质粒的副溶血弧菌(Vibrio Parhaemolyticus)是引起南美白对虾(Litopenaeus Vannamei)急性肝胰腺坏死病(AHPND)的病原,近年来给南美白对虾养殖业造成了严重的经济损失。培育南美白对虾抗弧菌亲本是有效控制该病发生的重要途径。由于基因组选择在选择精度和效率方面的优势,基因组选择有望成为加速抗病性状遗传改良的一种可行选择。本研究以实际和模拟数据为基础,对南美白对虾对副溶血弧菌的抗性遗传力进行了估算,并对南美白对虾进行GS基因改造的可行性进行了评价。虾对溶血性弧菌的抵抗力的遗传力约为0.15-0.24,这表明通过选择性育种可以实现遗传改良。基于真实数据对GS的后续分析表明,基因组最佳线性无偏预测(GBLUP)比传统的基于系谱的最佳线性无偏预测(PBLUP)更准确,生存时间的预测精度提高了6.8%,存活状态的预测精度提高了3.5%。同样,对于模拟数据,与GBLUP相比,生存时间和二元生存的预测精度相对提高了3.0%和5.0%。综上所述,GS可能是提高凡纳滨对虾对副溶血弧菌抗性遗传增益的一种替代途径。

南美白对虾是世界上养殖最广泛的海洋物种之一。但是,虾业受到病毒和细菌引起的疾病的阻碍。尤其是近年来,急性肝胰腺坏死病(AHPND),也称为早期死亡综合症(EMS),严重威胁了全球对虾养殖的可持续性和盈利能力。自2010年首次爆发AHPND以来,该病已在世界许多地区发生。据估计,到2013年,AHPND造成的年度经济损失超过10亿美元。为了减少AHPND对虾养殖造成的生产损失,已采取了包括改善虾养殖条件和加强养殖场管理在内的一些策略。此外,育种者更加关注选择性育种,这是减少水生动物疾病暴发的可持续方法。

选择性育种已被广泛用于水生动物各种疾病性状的遗传改良中(Gjedrem和Robinson,2014; Gjedrem等,2012)。然而,经典的选育方式的可靠性有限,因为它因为最多只能利用总遗传变异的50%(Nirea等,2012)。此外,此外,经过抗病性测试的动物不能用作繁殖种群。相比之下,基因组选择(GS)对于抗病性可能特别有价值。GS可以使用全基因组标记来计算候选育种动物的基因组估计育种价值(GEBV)(Meuwissen等,2001)。与传统的选择方法相比,GS可以提高抗病性状的选择准确性。另外,预计GS会降低近交率,因为它可以在家系中实现更好的区分,并降低同胞的共选率。最近对几种水生动物物种的研究表明,GS在加速抗病性状遗传改良过程中具有巨大潜力。然而,由于基因组大小的差异和不同性状的遗传结构,不同物种间不同性状的GS表现差异很大。以前的研究表明,GS是促进南美白对虾生长性状遗传改良的有力工具。然而,迄今为止,尚无报道调查GS对虾抗病性的可行性。因此,就其对南美白对虾溶血弧菌的抗性而言,评估GS在南美白对虾南美白对虾中的性能是有价值的。本研究对南美白对虾对副溶血弧菌的抗性遗传力进行了估计,并对GS用于提高对虾对副溶血弧菌抗性的可行性进行了评价,旨在为GS在对虾育种中的应用提供支持。

从中国海南省广泰海洋养殖公司获得的200只个体被用于挑战实验。简而言之,所有样本都来自2015年7月建立的 13个全同胞家系(13个母本和13个父本的后代)。 每个全同胞家系分别在5m2的水箱中培育幼苗。(家系饲养)在长到3厘米后,每个家庭中的50只个体被用荧光标记进行标记。贴上标签后,这些虾被集体饲养在一个10平方米的池塘里。(混养)在收获时,随机抽取了200只个体进行挑战实验。每只对虾注射副溶血弧菌10ul(本实验室分离株),浓度为2.52×107CFU/mL。将注入的对虾均匀分配到10个水箱中,加入25L过滤海水,水温保持在24±1°C。挑战试验持续194h,每隔4h记录死亡人数,记录个体存活时间。所有存活的虾在侵染194小时被收集。

对副溶血性弧菌的抵抗力为存活时间,定义为死亡的小时数,取值范围为16~194h;二元存活,如果对虾在攻击试验中死亡,则得分为0,如果虾存活到挑战试验结束,则得分为1。

基因分型方法与前面描述的相同(Wang等人,2007a)。从对虾肌肉中提取各样品的基因组DNA。所有样本个体都使用2bRAD技术进行了基因分型(Wang等人,2012年)。经过质量控制,剔除样本间漏检率大于5%、等位基因频率小于0.05的SNP,共获得23049个SNP标记。此外,Beagle 3.3.2用于推测缺失的基因型(Browning and Browning,2007)。

为了评估GS对多个体、多标记副溶血弧菌抗性的准确性,进行了模拟分析。QMSim软件被用于模拟具有实时过程的南美白对虾种群(Sargolzaei和Schenkel,2009)。首先,设计相等数量的雄性和雌性、离散世代、随机交配、不迁移和不选择,以2000个个体的恒定有效种群规模生成包括1000代的连续种群。然后,为了产生两个遗传分化的群体,从上一代(1000代)历史群体中随机抽取了300只动物(100只雄性和200只雌性)作为两个不同种群的创建者并且每个个体随机交配了30代。对于这两个种群,每个雌性都设定了50个后代(每个雄性100个后代),结果是每个世代有200个家系,有1万只繁殖动物。在1030代,分别从两个不同群体中随机抽取1000只动物进行基因组选择实验。由于南美白对虾对副溶血弧菌的抗性尚未开展过选育工作,因此在本步骤中没有进行选育。对于连续群体和近期群体,仅考虑加性效应的遗传力设置为0.2。模拟基因组由44条长度为97 cM的染色体组成,总长度为4268 cM,与南美白对虾的真实基因组大小相似(于等,2015)。对于每条染色体,模拟了1500个双等位基因标记和100个QTL。每个基因座的等位基因数量从2到4不等,QTL等位基因效应从形状参数为0.4的伽马分布中提取。标记突变率为2.5×10−5,QTL突变率为2.5×10-5。

基于谱系的最佳线性无偏预测(PBLUP):用BLUP(Henderson,1984)估计了传统的基于系谱的方差分量和估计育种值(EBV)。等式(1)和(2)分别用于真实数据集和模拟数据集:

基因组最佳线性无偏预测(GBLUP):基因组最佳线性无偏预测(GBLUP)模型被用来预测基因组估计育种值(GEBV)。除了使用基因组关系矩阵(G矩阵)之外,该模型与PBLUP模型类似,基因组关系矩阵的构造如下

其中W是第t个SNP的AA,Aa,aa基因型元素为2-2pt,1-2pt和-2pt的加性标记协变量的矩阵。pt是第t个SNP的等位基因A的频率qt = 1-pt ;m是SNPs的数量。

A矩阵是利用R包‘pedigreemm’中的两代系谱构建的。上述模型是由R包‘BGLR’使用贝叶斯方法实现的。Gibbs抽样总共使用了100,000次迭代,前10,000次迭代作为burn-in,被丢弃。

根据弧菌挑战实验记录的表型数据,计算了存活时间和二元存活的遗传力,如下所示:

其中σa2和σe2为加性遗传方差和残差方差。方差分量用BGLR程序包分别使用A矩阵和G矩阵进行估计。对于二元生存,残差方差设置为1

为了比较PBLUP和GBLUP的预测精度,采用了五次交叉验证方案。简而言之,数据集被随机分成五个子集。将四个子集(80%)组合成用于估计遗传效应的训练集,剩余的子集是验证集,其中表型记录被掩蔽。为了减少抽样的随机影响,交叉验证分析重复了20次。因此,共进行了100次交叉验证分析。

在模拟分析中,使用真实育种值(TBV)和EBV(GEBV)之间的相关性来衡量预测精度。在真实数据集中,TBV是未知的,因此预测精度调整如下。

其中r(EBV,y)是给定模型(使用来自训练集的信息对验证集进行预测)的EBV(GEBV)和y之间的相关性,y是观察到的表型;

h是利用系谱信息计算的遗传力的平方根。

对虾的平均体重为5.56±2.16g,平均体长为77.0±10.0 mm。不同家系的对虾在不同时间存活的情况如图1所示,死亡发生在感染后16h,一直持续到120h,感染实验结束时(194h)共死亡103只,占种群总数的51.5%。不同家系的对虾死亡率在0%(Fam13)~83%(Fam4)之间,表明利用选育技术提高凡纳滨对虾对副溶血弧菌的抗性是可行的。

狭义遗传力是数量遗传学的核心参数,代表加性遗传效应引起的总表型变异的比例。在这项研究中,通过使用来自13个全同胞家庭的挑战个体的表型,估计了生存时间和二元生存的方差分量。在这项研究中,通过使用来自13个全同胞家庭的挑战个体的表型,估计了生存时间和二元生存的方差组分。对于生存时间,用A矩阵和G矩阵估计的狭义遗传力分别为0.24±0.09和0.26±0.10。对于二元生存,使用A矩阵和G矩阵估计的狭义遗传力分别为0.15±0.07和0.16±0.09。这一结果表明,凡纳滨对虾对副溶血弧菌的抗性具有中等程度的遗传变异,这与以往报道的凡纳滨对虾抗病性状的遗传力为中低水平相似,其遗传力在h2=0.03的对WSSV抗性于0.3的对TSV抗性之间。虽然抗病性状表现出低到中等的遗传力,但通过传统的选择育种已经实现了遗传改良。对虾对TSV感染存活的遗传进展在12.4%~18.4%之间。南美白对虾感染WSSV后,经过三代的选择,估计存活的选择反应达到22.7%。在本研究中,对虾对副溶血弧菌的抵抗力估计为近似中等遗传力。这一结果表明,实施南美白对虾抗副溶血弧菌遗传改良的选育方案是可行的。

基于真实数据集,表1显示了基于PBLUP和GBLUP方法的生存时间和二元生存的预测精度。总之,GBLUP可以比PBLUP产生更准确的预测,并且预测准确度的相对增加对于生存时间是6.8%,对于二元生存率是3.5%。对于模拟数据集获得了相似的结果。当将PBLUP与GBLUP进行比较时,生存时间和二进制生存率的预测准确性分别提高了3.0%和5.0%。当前的研究表明,GS可以是加速该性状遗传进展的有效途径。

在当前的研究中,有趣的是注意到在真实数据集和模拟数据集之间,两种模型的预测精度都有细微的差异。实际数据集和模拟数据集之间的预测准确性差异可能是由几个因素引起的,包括群体规模,标记物密度和独立的染色体片段等。总的来说,这一结果表明关于凡纳滨对虾对副溶血性弧菌的抗性的遗传基础的假设,包括QTL的数目和QTL突变率等,可能很符合实际。此外,值得注意的是,在真实数据集中观察到的两种模型的预测精度的标准偏差比在模拟数据集中观察到的高。真实数据集中有限的种群规模和复杂的种群结构可能是导致预测精度差异较大的主要因素。以往对家畜、植物和水生动物的研究表明,训练种群规模的减小会对群体决策的预测能力产生负面影响,并显著降低预测质量。此外,包括训练群体的组成结构以及训练种群与验证种群之间的关系也是影响GEBV预测的关键因素,并可能导致基因组预测的准确性出现偏差。

虽然在模拟数据集中已经使用了大量的群体来评估GS的表现,但在比较PBLUP和GBLUP时,发现凡纳美乳杆菌对副溶血弧菌抗性的准确性提高得比以前的报道要低。例如,A发现,与使用57K SNP阵列对1934只动物进行基因分型的PBLUP相比,使用GBLUP对虹鳟鱼对鲑鱼的抗性进行预测的能力相对提高了28%。同样,在用50K SNP序列对2392个个体进行基因分型时,GBLUP模型和PBLUP模型相比,大西洋鲑鱼对三文鱼的抗性预测准确率相对提高(21%和27%)。结果表明,GBLUP模型与PBLUP模型相比,对大西洋鲑鱼对三文鱼的抗性预测准确率相对提高(21%和27%)。这些研究结果的差异可能与这些物种间连锁不平衡(LD)水平的差异有关。在本研究中,由于育种历史短和种群来源广泛,模拟种群可能具有极低的LD水平。因此,更多的标记将有利于增强GS的能力。此外,抗性性状被模拟为一个受大量效应较小的QTL控制的复杂性状,因此目前的群体规模可能仍不足以准确估计这些效应。因此,今后利用更多的标记和更多的表型来研究GS对对虾对副溶血弧菌的抗性是非常有价值的。

本研究检测到南美白对虾对副溶血弧菌的抗性具有接近中等的遗传力,表明通过选择育种进行遗传改良是可行的。GBLUP分析比PBLUP具有更高的预测精度,这表明GS可能是提高南美白对虾抗副溶血弧菌遗传增益的一种新途径。此外,还应利用群体规模大、标记密度高的经验数据来评价GS在提高对虾对副溶血弧菌抗性方面的有效性。

在介绍GS模型之前,我们有必要先来了解一下混合线性模型(Mixed Linear Model,MLM)。混合线性模型是一种方差分量模型,既然是线性模型,意味着各量之间的关系是线性的,可以应用叠加原理,即几个不同的输入量同时作用于系统的响应,等于几个输入量单独作用的响应之和(公式1)。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/11700749.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-18
下一篇 2023-05-18

发表评论

登录后才能评论

评论列表(0条)

保存