dfsd
释义:
1无病生存期(Disease Free Survival Dfs)
2企业性质
短语:
DFSD intern 信息数据员
wang liesdf dfsd sdfsdfsdfsdfsdfsdfsdf 说明功能强大
双语例句:
The above results shows that DFSD has testosterone-like effect, and it maymaintain the development of sexual subsidiary glands and keep these organs exerting their normal functions when gelded
结果提示东方神丹具有丙酸睾丸素样作用,对维持附属性腺的发育和正常功能具有重要意义。
我们经常用随机森林等机器学习又或者是其他数据挖掘的方法寻找某些疾病的biomarker或者候选基因。但是来自临床的数据包括了生存事件等信息,数据的内容有所不同,所以需要一些和之前不太一样分析方法,其中常见的就是通过制作生存曲线图获取结论。
生存曲线可以帮助我们回答许多问题:参与者生存5年的概率是多少?两组之间的生存率是否存在差异(例如,在临床试验中分配给新药还是标准药的两组之间)?某些行为或临床特征如何影响参与者的生存机会?
通常,在这类分析中,我们会关注特定事件(如死亡或疾病复发)的事件,并比较两组或更多组患者发生这些特定事件的事件。
可以看到上图显示了经常玩棋类游戏的老年人和很少玩这类游戏的老年人之间的痴呆风险Kaplan-Meier曲线。纵轴为非痴呆老人的比例,横轴为跟踪的年数,从图中可以看到经常玩棋类游戏的老年人患痴呆的风险较低。
在制作生长曲线之前,我们需要首先了解几个相关的术语
参考: R语言-Survival analysis(生存分析)
Event(事件): 指在随访过程中发生的某个结果,如癌症研究中,可能为复发(Relapse)、恶化(Progression)、死亡(Death)
Survival time(生存时间): 指某个事件开始到终止的时间,在癌症研究中经常用到的几个指标:
Overall survival(OS):
指从开始到任意原因死亡的时间,一般常见的5年生存率、10年生存率都是基于OS计算的
Progression-free Survival(PFS,无进展生存期):
指从开始到肿瘤发生任意进展或者死亡的时间,可用于评估治疗方法的临床效益
Time to Progress(TTP,疾病进展时间):
从开始到肿瘤发生任意进展或者进展前死亡的时间,与PFS相比仅包括肿瘤的恶化,而不包括死亡。
Disease-free Survival(DFS,无病生存期):
指从开始到肿瘤复发或任何原因死亡的时间,常用于根治性手术治疗或放疗后的辅助治疗的评估
Event Free Survival(EFS,无事件生存期):
指从开始到发生包括肿瘤进展、死亡、治疗方案的改变等各种事件的时间
Censoring(删失): 一般指不是由于死亡造成的数据丢失,可能是由于失访、非正常原因推出、时间终止而事件未发生等,一般在展示时用“+”表示
生存分析的方法一般可以分为三类:
1、参数法:已知生存时间的分布模型,根据数据估计模型参数,最后以分布模型计算生存率
2、半参数法:不需要知道生存时间的分布,但是仍通过模型来评估影响生存率的因素,常见方法如 Cox回归模型
3、非参数法:不需要知道生存时间的分布,根据样本统计量估计生存率,常见方法如 Kaplan-Meier方法、寿命法
具体地,我们通过同样一个例子介绍常用的Kaplan-Meier方法和寿命法的异同。
例子:一项探究死亡时间的前瞻性队列研究,研究涉及20位65岁以上的参与者,招募时间为5年,整个研究进行长达24年的随访直至死亡、研究结束或退出研究(失访)。因此,如果参与者是在研究开始后加入的,他们的最长随访时间应该少于24年。具体数据如下,其中有6位参与者死亡,3位接受了完整的随访(24年),其余11位由于在研究开始后加入或失访而少于24年随访:
寿命法
寿命法经常用于保险行业中估计预期寿命并设置保费。不过,我们只关注生物领域的使用,我们称为随访生命表,该表记录了参与者在队列研究或临床试验中在预定的随访期内的经历,直到目标事件发生或研究结束为止。
要构建生命表,我们要将随访时间分割成间距相等的几组,上述例子中我们随访的最长时间为24年,所以我们考虑5年一个间隔(0-4,5-9,10-14,15-19和20-24年)。然后统计每个时间间隔开始时活着的参与者人数,和该期间死亡人数和每个时间间隔中删失的人数。
然后,我们来定义几个参数:
N t =在时间间隔t内没有发生目标事件的但处于风险中的人数(如本研究中目标事件为死亡,而参与者都处于可能死亡的风险之中)
D t =在时间间隔t内死亡的人数
C t =在时间间隔t内删失的人数
N t =在时间间隔t内有风险的参与者的平均数(计算公式为:N t =N t -C t /2)
q t =时间间隔t内死亡比例,q t =D t /N t
p t =时间间隔t内生存比例,p t =1-q t
S t ,累计生存概率,S 0 =1,S t+1 =p t+1 S t
因此,对于第一个间隔0-4年和第二个5-9年的间隔,可以计算出如下数据:
所以完整的随访寿命表为:
Kaplan-Meier
Edward Kaplan和Paul Meier于1958年在《American Statistical Association》共同发表了Kaplan-Meier非参数估计方法,让我们能够估计生存函数。
从寿命表的方法可以看出生存概率会根据不同的间隔改变,尤其是对于小样本而言这种改变可能会很剧烈。Kaplan-Meier通过每次时间发生时重新估计生存概率来解决该问题。
Kaplan-Meier是基于这样的假设进行的:删失与事件发生的可能性无关,且在研究早期和后期被招募的参与者生存率是可比的。这些前提很重要,比如在不同组比较时要保证删失的可能性一致。
Kaplan-Meier与寿命法的计算方式类似,主要区别是时间间隔,寿命法中我们选择的时间间隔相等,而在Kaplan-Meier的方法中我们使用观察到的事件时间和删失时间。
上述的内容原版,以及关于进一步的检验和Cox模型的内容可以阅读Boston大学的教材 Boston Univeristy Suvival Analysis 。在这里暂时就不再解释啦。
今天我们要用到以下几个R包:survival,survminer和dplyr
使用KM方法,通过 ggsurvplot 作图,该函数作图需要两部分数据,具体见下:
1)需要什么格式的数据
我们使用的数据集为ovarian,来自survival包。该数据集来源于文章《Different Chemotherapeutic Sensitivities and Host Factors Affecting Prognosis in Advanced Ovarian Carcinoma vs Minimal Residual Disease》,主要研究化疗敏感性和宿主因素对晚期卵巢癌和微小残留病变的预后影响,具体含有以下几个指标:
futime: survival or censoring time 生存时间
fustat: censoring status 确定参与者生存时间是否发生缺失
age: in years
residds: residual disease present (1=no,2=yes) 评估肿瘤的消退情况
rx: treatment group 接受两种治疗方案中的一种
ecogps: ECOG performance status (1 is better, see reference)依据ECOG评估的患者表现
为了更直观的获取信息,我们根据说明修改一下部分指标的标记方式:
然后我们来看一下年龄的分布 hist(ovarian$age)
然后我们进行生存曲线的分析,使用futime和fustat两列,首先根据是否发生删失对数据进行处理。
可以看到发生删失的都带上了加号。
然后拟合Kaplan-Meier曲线:
2)如何作图
然后使用 ggsurvplot 功能进行绘图,如果选择 pval=TRUE 会显示两组差异检验结果的pvalue。
如果想要研究与residds的关系:
往期R数据可视化分享
R数据可视化13:瀑布图/突变图谱
R数据可视化12: 曼哈顿图
R数据可视化11: 相关性图
R数据可视化10: 蜜蜂图 Beeswarm
R数据可视化9: 棒棒糖图 Lollipop Chart
R数据可视化8: 金字塔图和偏差图
R数据可视化7: 气泡图 Bubble Plot
R数据可视化6: 面积图 Area Chart
R数据可视化5: 热图 Heatmap
R数据可视化4: PCA和PCoA图
R数据可视化3: 直方/条形图
R数据可视化2: 箱形图 Boxplot
R数据可视化1: 火山图
在计算机科学, 图遍历(Tree Traversal,也称图搜索)是一系列图搜索的算法, 是单次访问树结构类型数据(tree data structure)中每个节点以便检查或更新的一系列机制。图遍历算法可以按照节点访问顺序进行分类,根据访问目的或使用场景的不同,算法大致可分为28种:
图遍历即以特定方式访问图中所有节点,给定节点下有多种可能的搜索路径。假定以顺序方式进行(非并行),还未访问的节点就需通过堆栈(LIFO)或队列(FIFO)规则来确定访问先后。由于树结构是一种递归的数据结构,在清晰的定义下,未访问节点可存储在调用堆栈中。本文介绍了图遍历领域最流行的广度优先搜索算法BFS和深度优先搜索算法DFS,对其原理、应用及实现进行了阐述。通常意义上而言,深度优先搜索(DFS)通过递归调用堆栈比较容易实现,广义优先搜索通过队列实现。
深度优先搜索(DFS)是用于遍历或搜索图数据结构的算法,该算法从根节点开始(图搜索时可选择任意节点作为根节点)沿着每个分支进行搜索,分支搜索结束后在进行回溯。在进入下一节点之前,树的搜索尽可能的加深。
DFS的搜索算法如下(以二叉树为例):假定根节点(图的任意节点可作为根节点)标记为 ,
(L) : 递归遍历左子树,并在节点 结束。
(R): 递归遍历右子树,并在节点 结束。
(N): 访问节点 。
这些步骤可以以任意次序排列。如果(L)在(R)之前,则该过程称为从左到右的遍历;反之,则称为从右到左的遍历。根据访问次序的不同,深度优先搜索可分为 pre-order、in-order、out-order以及post-order遍历方式。
(a)检查当前节点是否为空;
(b)展示根节点或当前节点数据;
(c)递归调用pre-order函数遍历左子树;
(d)递归调用pre-order函数遍历右子树。
pre-order遍历属于拓扑排序后的遍历,父节点总是在任何子节点之前被访问。该遍历方式的图示如下:
遍历次序依次为:F -B -A-D- C-E-G- I-H
(a)检查当前节点是否为空;
(b)递归调用in-order函数遍历左子树;
(c)展示根节点或当前节点数据;
(d)递归调用in-order函数遍历右子树。
在二叉树搜索中,in-order遍历以排序顺序访问节点数据。该遍历方式的图示如下:
遍历次序依次为:A -B - C - D - E - F - G -H-I
(a)检查当前节点是否为空;
(b)递归调用out-order函数遍历右子树;
(c)展示根节点或当前节点数据;
(d)递归调用out-order函数遍历左子树。
该遍历方式与LNR类似,但先遍历右子树后遍历左子树。仍然以图2为例,遍历次序依次为:H- I-G- F- B- E- D- C- A
(a)检查当前节点是否为空;
(b)递归调用post-order函数遍历左子树;
(c)递归调用post-order函数遍历右子树;
(d)展示根节点或当前节点数据。
post-order遍历图示如下:
遍历次序依次为:A-C-E-D-B-H-I-G-F
pre-order遍历方式使用场景:用于创建树或图的副本;
in-order遍历使用场景:二叉树遍历;
post-order遍历使用场景:删除树
遍历追踪也称树的序列化,是所访问根节点列表。无论是pre-order,in-order或是post-order都无法完整的描述树特性。给定含有不同元素的树结构,pre-order或post-order与in-order遍历方式结合起来使用才可以描述树的独特性。
树或图形的访问也可以按照节点所处的级别进行遍历。在每次访问下一层级节点之前,遍历所在高层级的所有节点。BFS从根节点(图的任意节点可作为根节点)出发,在移动到下一节点之前访问所有相同深度水平的相邻节点。
BFS的遍历方法图示如下:
遍历次序依次为: F-B-G-A-D-I-C-E-H
图算法相关的R包为igraph,主要包括图的生成、图计算等一系列算法的实现。
使用方法:
参数说明:
示例:
结果展示:
DFS R输出节点排序:
使用方法:
参数含义同dfs
示例:
结果展示:
BFS R输出节点排序:
以寻找两点之间的路径为例,分别展示BFS及DFS的实现。图示例如下:
示例:
输出结果:
示例:
输出结果:
[1] 维基百科: >
首先打开你的dfs服务器,然后打开regedit注册表,然后Hkey Local Machine--system--currentcontrolset---services---DFSR---Paramenters找到stopReplicationOnAutoRecovery将其改为十进制的0
然后打开services管理器,找到DFS Repliction 和DFS Namespace右键重启即可。
DFS就会自动开始同步数据了,如果还不同步数据,你就要考虑是不是DFS复制组里面设置为单向复制或者将他们设置为“只读”模式了,是的话就改为“读写”模式。
暂存盘的设置也有一定的讲究,首先暂存一定不要和你的共享盘设在同一个盘,否则会有可能导致暂存占用了空间,导致共享盘没有空间存放资料,从而导致不同步的情况。暂存盘的大小,建议尽量设置大一点,这样可以加快同步的效率,但是不能大于你的磁盘容量。
注意:为了不影响大家正常访问DFS资源,建议把DFS复制带宽限制一下,否则长时间高带宽同步数据,会严重影响大家的访问速度。
以上就是关于dfsd 什么意思全部的内容,包括:dfsd 什么意思、R数据可视化14:生存曲线图、图遍历算法之DFS/BFS等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)