本文所演示的的可视化方法
散点图(Scatterplot)
直方图(Histogram)
小提琴图(Violinplot)
特征两两对比图(Pairplot)
安德鲁斯曲线(Andrewscurves)
核密度图(Kerneldensityestimationplot)
平行坐标图(Parallelcoordinates)
Radviz(力矩图?)
热力图(Heatmap)
气泡图(Bubbleplot)
这里主要使用Python一个流行的作图工具:Seabornlibrary,同时Pandas和bubbly辅助。为什么Seaborn比较好?
因为很多时候数据分析,建模前,都要清洗数据,清洗后数据的结果总要有个格式,我知道的最容易使用,最方便输入模型,最好画图的格式叫做\"TidyData\"(WickhamHTidydata[J]JournalofStatisticalSoftware,2014,59(10):1-23)其实很简单,TidyData格式就是:
每条观察(记录)自己占一行
观察(记录)的每个特征自己占一列
举个例子,我们即将作图的数据集IRIS就是TidyData(IRIS(IRIS数据集)_百度百科):
Iris数据集是常用的分类实验数据集,由Fisher,1936收集整理。Iris也称鸢尾花卉数据集,是一类多重变量分析的数据集。数据集包含150个数据集,分为3类,每类50个数据,每个数据包含4个属性。可通过花萼长度,花萼宽度,花瓣长度,花瓣宽度4个属性预测鸢尾花卉属于(Setosa,Versicolour,Virginica)三个种类中的哪一类。
该数据集包含了5个属性:
SepalLength(花萼长度),单位是cm;
SepalWidth(花萼宽度),单位是cm;
PetalLength(花瓣长度),单位是cm;
PetalWidth(花瓣宽度),单位是cm;
种类:IrisSetosa(山鸢尾)、IrisVersicolour(杂色鸢尾),以及IrisVirginica(维吉尼亚鸢尾)。
IRIS数据可以看到,每条观察(ID=0,1,2)自己占一行,每个特征(四个部位长/宽度,种类)自己占一列。Seaborn就是为TidyData设计的,所以方便使用。
所以这个数据集有6列,6个特征,很多时候做可视化就是为了更好的了解数据,比如这里就是想看每个种类的花有什么特点,怎么样根据其他特征把花分为三类。我个人的喜好是首先一张图尽量多的包含数据点,展示数据信息,从中发现规律。我们可以利用以下代码完全展示全部维度和数据这里用的bubbly:
三维图,全局观察Python做出来,其实是一张可以拖动角度,放大缩小的图,拖一拖看各角度视图会发现三类还是分的挺明显的。Github上这个bubbly还是很厉害的,方便。
接下来开始做一些基础的可视化,没有用任何修饰,代码只有最关键的画图部分,可视化作为比赛的一个基础和开端,个人理解做出的图能看就行,美不美无所谓,不美也不扣分。因为
散点图,可以得到相关性等信息,比如基本上SepalLengthCm越大,SepalWidthCm越大
散点图使用Jointplot,看两个变量的分布,KDE图,同时展示对应的数据点
就像上一篇说的,比赛中的每个环节都至关重要,很有必要看下这些分布直方图,kde图,根据这些来处理异常值等,这里请教,为什么画了直方图还要画KDE??我理解说的都是差不多的东西。
关于KDE:\"由于核密度估计方法不利用有关数据分布的先验知识,对数据分布不附加任何假定,是一种从数据样本本身出发研究数据分布特征的方法,因而,在统计学理论和应用领域均受到高度的重视。\"
无论如何,我们先画直方图,再画KDE
直方图KDE图这里通过KDE可以说,由于Setosa的KDE与其他两种没有交集,直接可以用Petailength线性区分Setosa与其他两个物种。
Pairplot箱线图,显示一组数据分散情况的统计图。形状如箱子。主要用于反映原始数据分布的特征,关键的5个黑线是最大值、最小值、中位数和两个四分位数。在判断异常值,处理异常值时候有用。
BoxPlot小提琴图
Violinplot这个Andrewscurves很有趣,它是把所有特征组合起来,计算个值,展示该值,可以用来确认这三个物种到底好不好区分,维基百科的说法是“Ifthereisstructureinthedata,itmaybevisibleintheAndrews'curvesofthedata”(Andrewsplot-Wikipedia)
Andrews'curvesradvizRadviz可视化原理是将一系列多维空间的点通过非线性方法映射到二维空间的可视化技术,是基于圆形平行坐标系的设计思想而提出的多维可视化方法。圆形的m条半径表示m维空间,使用坐标系中的一点代表多为信息对象,其实现原理参照物理学中物体受力平衡定理。多维空间的点映射到二维可视空间的位置由d簧引力分析模型确定。(Radviz可视化原理-CSDN博客),能展示一些数据的可区分规律。
数值是皮尔森相关系数,浅颜色表示相关性高,比如PetalLength(花瓣长度)与PetalWidth(花瓣宽度)相关性096,也就是花瓣长的花,花瓣宽度也大,也就是个大花。
不过,现在做可视化基本上不用python了,具体为什么可以去看我的写的文章,我拿python做了爬虫,BI做了可视化,效果和速度都很好。
finereport
可视化的一大应用就是数据报表,而FineReport可以自由编写整合所需要的报表字段进行报表输出,支持定时刷新和监控邮件提醒,是大部分互联网公司会用到的日常报表平台。
尤其是公司体系内经营报表,我们用的是商业报表工具,就是finereport。推荐他是因为有两个高效率的点:①可以完成从数据库取数(有整合数据功能)—设计报表模板—数据展示的过程。②类似excel做报表,一张模板配合参数查询可以代替几十张报表。
FineBI
简洁明了的数据分析工具,也是我个人最喜欢的可视化工具,优点是零代码可视化、可视化图表丰富,只需要拖拖拽拽就可以完成十分炫酷的可视化效果,拥有数据整合、可视化数据处理、探索性分析、数据挖掘、可视化分析报告等功能,更重要的是个人版免费。
主要优点是可以实现自助式分析,而且学习成本极低,几乎不需要太深奥的编程基础,比起很多国外的工具都比较易用上手,非常适合经常业务人员和运营人员。在综合性方面,FineBI的表现比较突出,不需要编程而且简单易做,能够实现平台展示,比较适合企业用户和个人用户,在数据可视化方面是一个不错的选择;
这些是我见过比较常用的,对数据探索有帮助的可视化方法。
这个非常简单,PyQt就可以轻松实现,一个基于Qt的接口包,可以直接拖拽控件设计UI界面,下面我简单介绍一下这个包的安装和使用,感兴趣的朋友可以自己尝试一下:
1首先,安装PyQt模块,这个直接在cmd窗口输入命令“pipinstallpyqt5”就行,如下,整个模块比较大,下载过程需要等待一会儿,保持联网:
2安装完成后,我们就可以直接打开Qt自带的QtDesigner设计师设计界面了,这里默认会安装到site-packages->PyQt5->Qt->bin目录,打开后的界面如下,可以直接新建对话框等窗口,所有的控件都可以直接拖拽,编辑属性,非常方便:
3这里我简单的设计了一个登录窗口,2个输入框和2个按钮,如下,这里可以直接使用QSS对界面进行美化(设置styleSheet属性即可),类似网页的CSS,如果你有一定的前端基础,那么美化起来会非常容易:
设计完成后,还只是一个ui文件,不是现成的Python代码,还需要借助pyuic5工具(也在bin目录下)才能将ui文件转化为Python代码,切换到ui文件所在目录,输入命令“pyuic5-ologinpyloginui”即可(这里替换成你的ui文件),转化成功后的Python代码如下(部分截图):
还需要在最下面添加一个main函数,创建上面Ui_Form类对象显示窗口即可,如下:
最后点击运行程序,效果如下,和刚才设计的界面效果一模一样:
至此,我们就完成了利用Python的PyQt模块直接拖拽控件来设计UI界面。总的来说,整个过程非常简单,只要你有一定的Python基础,熟悉一下 *** 作过程,很快就能掌握的,当然,还有许多其他UI开发模块,像tkinter,wxPython,Eric6等,也都非常不错,网上也有相关教程和资料,介绍的非常详细,感兴趣的话,可以搜一下,希望以上分享的内容能对你有所帮助吧,也欢迎大家评论、留言进行补充。
首先,如果没有安装python和PyQt软件的请先直接搜索下载并安装。python是一个开源软件,因此都是可以在网上免费下载的,最新版本即可。下载完成后,我们先打开PyQtdesigner。
2
打开后,首先是一个默认的新建窗口界面,在这里我们就选择默认的窗口即可。
3
现在是一个完全空白的窗口。第一步我们要先把所有的设计元素都拖进这个窗口。我们先拖入一个“Label”,就是一个不可编辑的标签。
随后我们再拖入一个可以编辑的“LineEdit”
最后我们拖入最后一个元素:“PushButton”按钮,也就是平时我们所点的确定。
目前我们已经把所有所需要的元素都拖入了新建的窗口。对于每一个元素,我们都可以双击进行属性值的修改,此时我们仅需要双击改个名字即可
此时我们已经完成了一半,接下来需要对动作信号进行 *** 作。我们需要先切入编辑信号的模式
此时把鼠标移动到任意元素,都会发现其变成红色,代表其被选中。
当我们选中pushbutton后,继续拖动鼠标指向上面的lineedit,会发现由pushbutton出现一个箭头指向了lineedit,代表pushbutton的动作会对lineedit进行 *** 作。
随即会d出一个配置连接窗口。左边的是pushbutton的 *** 作,我们选择clicked(),即点击pushbutton。
右边是对lineedit的 *** 作,我们选择clear(),即清楚lineedit中的内容。
最后我们点击确定。
保存完成后,我们在PyQt中的 *** 作就已经完成了。保存的文件名我们命名为test,PyQt生成的设计文件后缀是ui。
Qt有开源版本,也有商业版本
开源版本必须遵循相关开源协议而商业版本Digia会提供技术支持,但是要钱的
Src是包含源码由于VS2008和VS2010的msvc编译版本不同,所以会存在两个版本mingw只是个包含win环境下g编译器的工具集而已
由于Qt纯C环境,msvc和mingw都可以编译如果你是在VS环境下,只需要下载vs-addin和(vs-)即可两个安装完成你就可以在VS上创建你的Qt项目了而如果你想直接用Qt的IDE,就是QtCreator,你下载之后,下载(any),QtCreator可以配置编译器的
这些都不需要你直接去make,因为这些下载好了是包含相应的动态链接库的
使用Qt进行软件开发,不可避免要使用资源文件。本节我们做一个简单示例,通过使用Qt资源文件为应用程序及关闭按钮设置图标。
根据前面我们所讲述的内容,先创建PyCharm工程项目,然后创建Qt工程项目,在Qt工程项目中设计界面并创建资源文件。
界面中我们只放置一个“关闭”按钮,所以在此不做具体的描述。下面,我们创建资源文件。
在Qt Creator中选择“File” -> "New File or Project",然后选择“Qt”->"Qt Resource File",在File name中输入res,在项目中可以看到,我们创建了一个resqrc资源文件。
在资源文件上右击,选择”Open in Editor“即可打开资源文件编辑器。
在资源文件中首先需要创建一个前缀,名称可以根据具体的资源进行命名,我们在此处命名为:icons;然后单击”Add Files“,选择事先准备好的图标文件添加进来。
在按钮的属性编辑器中找到icon属性,点击下拉菜单中的”Choose Resource“,在对话框中选择对应的资源文件中的图标即可。
编译资源文件:
在PyCharm的工程项目中创建一个名为rccbat的批处理文件,其代码如下:
注意:编译资源文件时,生成的py文件名结尾必须是_rc,因为编译窗体文件后会产生如下语句:
编译窗体文件:
在PyCharm的工程项目中创建一个名为uicbat的批处理文件,其代码如下:
运行以上两个批处理文件,可以看到编译后的py文件已经生成。
执行程序后可以看到,界面中的关闭按钮显示了我们在Qt Creator中设置的图标。
引入图标类:
在主程序中app = QApplication(sysargv)语句后面增加设置图标的代码:
为”关闭“按钮添加单击事件代码:
运行程序即可看到应用程序的图标也可以显示了。
PyQt5是基于Digia公司强大的图形程式框架Qt5的python接口,由一组python模块构成。PyQt5本身拥有超过620个类和6000函数及方法。在可以运行于多个平台,包括:Unix,Windows,andMacOS。
PyQt5并不向下兼容PyQt4,主要是由于其有几个较大的改变。虽不兼容,但是旧代码调整到新库并不是很难。它们的主要差异如下:Python的模块已经重新构建,一些模块已经被放弃,如:QtScript。其他的模块被分割到一些子模块当中,如:QtGui,QtWebkit。
PyQt5不支持在Qtv50中标记为已弃用或过时的QtAPI的任何部分。
输入做加法
今天我们做一个简单的输入做加法的一个界面,涉及内容:
1、输入框
2、按钮事件
3、框内容获取和修改
UI布局
首先按照第二讲的说法,拖出一个和我一样的界面,功能实现就是A+B=C,左边两个输入框和输出框是Line Edit控件,然后最右边是一个按键Push Button按钮。
在属性界面找到三个框和按钮的objectName,分别命名A\B\C和Calculate
首先布局界面,然后按照上一讲的方法,进行显示,但是你发现你按计算按钮没有任何反应,这就要讲到下一个知识点,按钮点击事件。
按钮事件
实现A+B之前,我们先熟悉按钮点击事件,我们先再拖两个按钮,命名可以不管,显示文字改为显示和隐藏。如下图
然后找到菜单栏,找到添加槽和信号按钮。
然后鼠标点显示不要放,鼠标移动到B输入框会出现以下界面,简单理解就是显示按钮的什么信号会触发B输入框的什么动作。
这边左下角的勾打上,然后左边表示按钮显示出发了什么信号,我们选择点击信号,右边表示需要连接到什么动作,我们选择B框的show(),表示B框的显示。隐藏按钮同理,左边选择点击信号,右边选择hide(),表示隐藏。
然后保存,转码后,运行mainpy,显示状态如下,效果是不是很明显。
那么我们现在回到刚刚的加法,计算按钮上,由于我们使用的是A+B算法,所以我们这个触发的动作需要自己写,因此在连接信号和槽框中,信号直接拉出来放在空白处,然后出来的槽动作那边点编辑
在出来的d窗中点击+,添加槽函数,输入CalculateClick()。相当于一旦我点击计算按钮,我就会调用这个函数的意思。
然后对应的选择好之后,点击OK,保存UI,并用PyUIC进行转码
然后我们打开UIpy,我们会发现这个函数,意思就是我们按钮的点击链接到了Calculate函数。然后我们需要在主函数中重写这个函数。因为我们本身UI不带这个函数
这边我们需要对UI界面类进行重写,在主函数中添加以下代码:
class Mywindow(QtWidgetsQMainWindow, Ui_MainWindow):
def __init__(self):
super(Mywindow, self)__init__()
selfsetupUi(self)
def CalculateClcik(self):
print("触发按钮。")
以上就是关于python可视化界面怎么做全部的内容,包括:python可视化界面怎么做、《pyqt5快速开发与实战》PDF_pyqt5从入门到实践、「1.PyQt5 GUI 软件开发框架」4.使用Qt资源文件等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)