TCGA+biomarker——Nomogram列线图

TCGA+biomarker——Nomogram列线图,第1张

线图(Alignment Diagram),又称诺莫图(Nomogram图),它是建立在多因素回归分析的基础上,将多个预测指标进行整合,然后采用带有刻度的线段,按照一定的比例绘制在同一平面上,从而用以表达预测模型中各个变量之间的相互关系。它的基本原理,简单的说,就是通过构建多因素回归模型(常用的回归模型,例如Cox回归、Logistic回归等),根据模型中各个影响因素对结局变量的贡献程度(回归系数的大小),给每个影响因素的每个取值水平进行赋分,然后再将各个评分相加得到总评分,最后通过总评分与结局事件发生概率之间的函数转换关系,从而计算出该个体结局事件的预测值。列线图将复杂的回归方程,转变为了可视化的图形,使预测模型的结果更具有可读性,方便对患者进行评估。正是由于列线图这种直观便于理解的特点,使它在医学研究和临床实践中也逐渐得到了越来越多的关注和应用。

解释: 假设有一个患者,治疗方式是Resection,肿瘤大小是3-5,复发部位是Intrahepatic,多处复发是No,复发时间是1-2,复发时AFP是>200,复发时albumin-bilirutinl grade是II, III,抗病毒治疗是Yes。在图上找到各个点,对应上方Point的值,将所有的值相加(本处只是讲解大概的值,具体数值应该在模型中计算:Total Points=0+42+20+0+4+31+22+0=119)。在Total中我们可以看到,119对应的2年和5年的生存率分别约为080和068(本处是大致值,由于没有具体模型参数,无法给出精确值)。这就进一步说明Nomogram图的内容,本质就是对模型各个参数的一个直观展示。

结果如下:这类结果过于简陋!

regplot包中的regplot()函数可绘制较为美观的nomogram。但是,它目前只接收coxph()、lm()和glm()函数返回的回归对象。

如下图,regplot绘图更加美观,可以比较灵活的定义细节。

可任意标记想突出的患者在列线图上的分值分布,及事件发生风险概率!

网络参考
>snscolor_palette(x, y)   # x为画板,y为分割的份数

例如:snspalplot(snscolor_palette('hls', 12))

snshls_palette(x, l, s)   # l为亮度, s为饱和度(都介于0-1之间),x为份数

snscolor_palette('Paired', 8)  # 颜色成对出现,共8个

snsxkcd_rgb['str']   # str表示rgb色板中的具体某个颜色

snscolor_palette('str')   # str为指定颜色,str后加'_r'表示颜色渐变反转

snslight_palette('str', reverse=True)   # 颜色由浅到深,加reverse就反转

snsdark_palette('str')   # 由深到浅

snsdisplot(x, bins=num, kde=bool)   # bins平均分成多少等份

iris = snsload_dataset('iris')   # iris类型的数据集

snspairplot(iris)   # 把数据中两两之间的关系图绘制出来

snsregplot(x='', y='', data='', x_jitter=浮动范围)   # x为横坐标,y为纵坐标,data为dataframe格式,x_jitter对数值进行浮动

snsstripplot(x='', y='', data='', jitter=bool)   # data为tips格式,jitter表示数据浮动

snsboxplot(x='', y='', hue='', data=tips)   # 确定xy轴,hue为图例,修改xy可更改图的方向

snsviolinplot(x='', y='', hue='', data=tips, split=bool)   # 确定xy轴,hue为图例,split不同类型排布在一起
第一行表示选择要展示的内容,第二行确定图的类型和横纵坐标,alpha表示透明度

snsheatmap(data, vmin, vmax, center='', annot=bool, fmt='d', linewidth='', cmap='', )

# pivot()函数可将数据转换为矩阵

snsjointplot画图时,设置坐标轴刻度字号大小的方法:
1、打开几何画板,选择“编辑”——“预置”,在d出的预置对话框下选择“文本”选项,点击“改变对象属性”。
2、在d出的文本样式对话框选择“坐标轴上的数字”,在右边下拉菜单选择相应的字体和字号,然后点击“确定”按钮。

Seaborn 基于 Matplotlib 核心库进行了更高阶的 API 封装,可以让你轻松地画出更漂亮的图形。Seaborn 的漂亮主要体现在配色更加舒服、以及图形元素的样式更加细腻,下面是 Seaborn 官方给出的参考图。

Seaborn 具有如下特点:
内置数个经过优化的样式效果。
增加调色板工具,可以很方便地为数据搭配颜色。
单变量和双变量分布绘图更为简单,可用于对数据子集相互比较。
对独立变量和相关变量进行回归拟合和可视化更加便捷。
对数据矩阵进行可视化,并使用聚类算法进行分析。
基于时间序列的绘制和统计功能,更加灵活的不确定度估计。
基于网格绘制出更加复杂的图像集合。
除此之外, Seaborn 对 Matplotlib 和 Pandas 的数据结构高度兼容。

当我们使用 Matplotlib 绘图时,默认的图像样式算不上美观。此时,就可以使用 Seaborn 完成快速优化。

相比于 Matplotlib 默认的纯白色背景,Seaborn 默认的浅灰色网格背景看起来的确要细腻舒适一些。而柱状图的色调、坐标轴的字体大小也都有一些变化。
snsset() 的默认参数为:

context='' 参数控制着默认的画幅大小,分别有 {paper, notebook, talk, poster} 四个值。其中,poster > talk > notebook > paper。
style='' 参数控制默认样式,分别有 {darkgrid, whitegrid, dark, white, ticks},你可以自行更改查看它们之间的不同。
palette='' 参数为预设的调色板。分别有 {deep, muted, bright, pastel, dark, colorblind} 等,你可以自行更改查看它们之间的不同。
剩下的 font='' 用于设置字体,font_scale= 设置字体大小,color_codes= 不使用调色板而采用先前的 'r' 等色彩缩写。

根据图形的适应场景,Seaborn 的绘图方法大致分类 6 类,分别是:关联图、类别图、分布图、回归图、矩阵图和组合图。而这 6 大类下面又包含不同数量的绘图函数。
关联图

我们指定 x和 y的特征,默认可以绘制出散点图

加入类别特征对数据进行着色,就更好一些了

Seaborn 的函数都有大量实用的参数,例如我们指定 style 参数可以赋予不同类别的散点不同的形状。

不只是散点图,该方法还支持线形图,只需要指定 kind="line" 参数即可。线形图和散点图适用于不同类型的数据。线形态绘制时还会自动给出 95% 的置信区间。

relplot 看作是 scatterplot 和 lineplot 的结合版本。
Seaborn 中的 API 分为 Figure-level 和 Axes-level 两种。relplot 就是一个 Figure-level 接口,而 scatterplot 和 lineplot 则是 Axes-level 接口。
Figure-level 和 Axes-level API 的区别在于,Axes-level 的函数可以实现与 Matplotlib 更灵活和紧密的结合,而 Figure-level 则更像是「懒人函数」,适合于快速应用。
例如上方的图,我们也可以使用 lineplot 函数绘制

类别图
类别图的 Figure-level 接口是 catplot,其为 categorical plots 的缩写。而 catplot 实际上是如下 Axes-level 绘图 API 的集合:

分类散点图:
stripplot() ( kind="strip" )
swarmplot() ( kind="swarm" )

分类分布图:
boxplot() ( kind="box" )
violinplot() ( kind="violin" )
boxenplot() ( kind="boxen" )

分类估计图:
pointplot() ( kind="point" )
barplot() ( kind="bar" )
countplot() ( kind="count" )

catplot 绘图效果,该方法默认是绘制 kind="strip" 散点图。

kind="swarm" 可以让散点按照 beeswarm 的方式防止重叠,可以更好地观测数据分布。

hue= 参数可以给图像引入另一个维度,如果一个数据集有多个类别,hue= 参数就可以让数据点有更好的区分。
绘制箱线图:

绘制小提琴图:

绘制增强箱线图:

绘制点线图:

绘制条形图:

绘制计数条形图:

分布图
分布图主要是用于可视化变量的分布情况,一般分为单变量分布和多变量分布。当然这里的多变量多指二元变量,更多的变量无法绘制出直观的可视化图形。
Seaborn 提供的分布图绘制方法一般有这几个: jointplot , pairplot , distplot , kdeplot 。
Seaborn 快速查看单变量分布的方法是 distplot。默认情况下,该方法将会绘制直方图并拟合核密度估计图。

distplot 提供了参数来调整直方图和核密度估计图,例如设置 kde=False 则可以只绘制直方图,或者 hist=False 只绘制核密度估计图。当然,kdeplot 可以专门用于绘制核密度估计图,其效果和 distplot(hist=False) 一致,但 kdeplot 拥有更多的自定义设置。

jointplot 主要是用于绘制二元变量分布图。例如,我们探寻 sepal_length 和 sepal_width 二元特征变量之间的关系。

jointplot 并不是一个 Figure-level 接口,但其支持 kind= 参数指定绘制出不同样式的分布图。例如,绘制出核密度估计对比图。

六边形计数图:

回归拟合图:

pairplot 其支持一次性将数据集中的特征变量两两对比绘图。默认情况下,对角线上是单变量分布图,而其他则是二元变量分布图。

引入第三维度 hue="species" 会更加直观。

回归图
回归图的绘制函数主要有: lmplot 和 regplot 。
regplot 绘制回归图时,只需要指定自变量和因变量即可,regplot 会自动完成线性回归拟合。

lmplot 同样是用于绘制回归图,但 lmplot 支持引入第三维度进行对比,例如我们设置 hue="species"。

矩阵图
矩阵图中最常用的就只有 2 个,分别是: heatmap 和 clustermap 。
heatmap 主要用于绘制热力图。

热力图在某些场景下非常实用,例如绘制出变量相关性系数热力图。
clustermap 支持绘制 层次聚类 结构图。如下所示,我们先去掉原数据集中最后一个目标列,传入特征数据即可。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/12963541.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-29
下一篇 2023-05-29

发表评论

登录后才能评论

评论列表(0条)

保存