给大家带来的一篇关于Python数据相关的电子书资源,介绍了关于Python方面的内容,本书是由人民邮电出版社出版,格式为PDF,资源大小281 MB,黄红梅 张良均编写,目前豆瓣、亚马逊、当当、京东等电子书综合评分为:78。
内容介绍
目录
第1章 Python数据分析概述 1
任务11 认识数据分析 1
111 掌握数据分析的概念 2
112 掌握数据分析的流程 2
113 了解数据分析应用场景 4
任务12 熟悉Python数据分析的工具 5
121 了解数据分析常用工具 6
122 了解Python数据分析的优势 7
123 了解Python数据分析常用类库 7
任务13 安装Python的Anaconda发行版 9
131 了解Python的Anaconda发行版 9
132 在Windows系统中安装Anaconda 9
133 在Linux系统中安装Anaconda 12
任务14 掌握Jupyter Notebook常用功能 14
141 掌握Jupyter Notebook的基本功能 14
142 掌握Jupyter Notebook的高 级功能 16
小结 19
课后习题 19
第2章 NumPy数值计算基础 21
任务21 掌握NumPy数组对象ndarray 21
211 创建数组对象 21
212 生成随机数 27
213 通过索引访问数组 29
214 变换数组的形态 31
任务22 掌握NumPy矩阵与通用函数 34
221 创建NumPy矩阵 34
222 掌握ufunc函数 37
任务23 利用NumPy进行统计分析 41
231 读/写文件 41
232 使用函数进行简单的统计分析 44
233 任务实现 48
小结 50
实训 50
实训1 创建数组并进行运算 50
实训2 创建一个国际象棋的棋盘 50
课后习题 51
第3章 Matplotlib数据可视化基础 52
任务31 掌握绘图基础语法与常用参数 52
311 掌握pyplot基础语法 53
312 设置pyplot的动态rc参数 56
任务32 分析特征间的关系 59
321 绘制散点图 59
322 绘制折线图 62
323 任务实现 65
任务33 分析特征内部数据分布与分散状况 68
331 绘制直方图 68
332 绘制饼图 70
333 绘制箱线图 71
334 任务实现 73
小结 77
实训 78
实训1 分析1996 2015年人口数据特征间的关系 78
实训2 分析1996 2015年人口数据各个特征的分布与分散状况 78
课后习题 79
第4章 pandas统计分析基础 80
任务41 读/写不同数据源的数据 80
411 读/写数据库数据 80
412 读/写文本文件 83
413 读/写Excel文件 87
414 任务实现 88
任务42 掌握DataFrame的常用 *** 作 89
421 查看DataFrame的常用属性 89
422 查改增删DataFrame数据 91
423 描述分析DataFrame数据 101
424 任务实现 104
任务43 转换与处理时间序列数据 107
431 转换字符串时间为标准时间 107
432 提取时间序列数据信息 109
433 加减时间数据 110
434 任务实现 111
任务44 使用分组聚合进行组内计算 113
441 使用groupby方法拆分数据 114
442 使用agg方法聚合数据 116
443 使用apply方法聚合数据 119
444 使用transform方法聚合数据 121
445 任务实现 121
任务45 创建透视表与交叉表 123
451 使用pivot_table函数创建透视表 123
452 使用crosstab函数创建交叉表 127
453 任务实现 128
小结 130
实训 130
实训1 读取并查看P2P网络贷款数据主表的基本信息 130
实训2 提取用户信息更新表和登录信息表的时间信息 130
实训3 使用分组聚合方法进一步分析用户信息更新表和登录信息表 131
实训4 对用户信息更新表和登录信息表进行长宽表转换 131
课后习题 131
第5章 使用pandas进行数据预处理 133
任务51 合并数据 133
511 堆叠合并数据 133
512 主键合并数据 136
513 重叠合并数据 139
514 任务实现 140
任务52 清洗数据 141
521 检测与处理重复值 141
522 检测与处理缺失值 146
523 检测与处理异常值 149
524 任务实现 152
任务53 标准化数据 154
531 离差标准化数据 154
532 标准差标准化数据 155
533 小数定标标准化数据 156
534 任务实现 157
任务54 转换数据 158
541 哑变量处理类别型数据 158
542 离散化连续型数据 160
543 任务实现 162
小结 163
实训 164
实训1 插补用户用电量数据缺失值 164
实训2 合并线损、用电量趋势与线路告警数据 164
实训3 标准化建模专家样本数据 164
课后习题 165
第6章 使用scikit-learn构建模型 167
任务61 使用sklearn转换器处理数据 167
611 加载datasets模块中的数据集 167
612 将数据集划分为训练集和测试集 170
613 使用sklearn转换器进行数据预处理与降维 172
614 任务实现 174
任务62 构建并评价聚类模型 176
621 使用sklearn估计器构建聚类模型 176
622 评价聚类模型 179
623 任务实现 182
任务63 构建并评价分类模型 183
631 使用sklearn估计器构建分类模型 183
632 评价分类模型 186
633 任务实现 188
任务64 构建并评价回归模型 190
641 使用sklearn估计器构建线性回归模型 190
642 评价回归模型 193
643 任务实现 194
小结 196
实训 196
实训1 使用sklearn处理wine和wine_quality数据集 196
实训2 构建基于wine数据集的K-Means聚类模型 196
实训3 构建基于wine数据集的SVM分类模型 197
实训4 构建基于wine_quality数据集的回归模型 197
课后习题 198
第7章 航空公司客户价值分析 199
任务71 了解航空公司现状与客户价值分析 199
711 了解航空公司现状 200
712 认识客户价值分析 201
713 熟悉航空客户价值分析的步骤与流程 201
任务72 预处理航空客户数据 202
721 处理数据缺失值与异常值 202
722 构建航空客户价值分析关键特征 202
723 标准化LRFMC模型的5个特征 206
724 任务实现 207
任务73 使用K-Means算法进行客户分群 209
731 了解K-Means聚类算法 209
732 分析聚类结果 210
733 模型应用 213
734 任务实现 214
小结 215
实训 215
实训1 处理xyk数据异常值 215
实训2 构造xyk客户风险评价关键特征 217
实训3 构建K-Means聚类模型 218
课后习题 218
第8章 财政收入预测分析 220
任务81 了解财政收入预测的背景与方法 220
811 分析财政收入预测背景 220
812 了解财政收入预测的方法 222
813 熟悉财政收入预测的步骤与流程 223
任务82 分析财政收入数据特征的相关性 223
821 了解相关性分析 223
822 分析计算结果 224
823 任务实现 225
任务83 使用Lasso回归选取财政收入预测的关键特征 225
831 了解Lasso回归方法 226
832 分析Lasso回归结果 227
833 任务实现 227
任务84 使用灰色预测和SVR构建财政收入预测模型 228
841 了解灰色预测算法 228
842 了解SVR算法 229
843 分析预测结果 232
844 任务实现 234
小结 236
实训 236
实训1 求取企业所得税各特征间的相关系数 236
实训2 选取企业所得税预测关键特征 237
实训3 构建企业所得税预测模型 237
课后习题 237
第9章 家用热水器用户行为分析与事件识别 239
任务91 了解家用热水器用户行为分析的背景与步骤 239
911 分析家用热水器行业现状 240
912 了解热水器采集数据基本情况 240
913 熟悉家用热水器用户行为分析的步骤与流程 241
任务92 预处理热水器用户用水数据 242
921 删除冗余特征 242
922 划分用水事件 243
923 确定单次用水事件时长阈值 244
924 任务实现 246
任务93 构建用水行为特征并筛选用水事件 247
931 构建用水时长与频率特征 248
932 构建用水量与波动特征 249
933 筛选候选洗浴事件 250
934 任务实现 251
任务94 构建行为事件分析的BP神经网络模型 255
941 了解BP神经网络算法原理 255
942 构建模型 259
943 评估模型 260
944 任务实现 260
小结 263
实训 263
实训1 清洗运营商客户数据 263
实训2 筛选客户运营商数据 264
实训3 构建神经网络预测模型 265
课后习题 265
附录A 267
附录B 270
参考文献 295
学习笔记
Jupyter Notebook(此前被称为 IPython notebook)是一个交互式笔记本,支持运行 40 多种编程语言。 Jupyter Notebook 的本质是一个 Web 应用程序,便于创建和共享文学化程序文档,支持实时代码,数学方程,可视化和 markdown。 用途包括:数据清理和转换,数值模拟,统计建模,机器学习等等 。 定义 (推荐学习:Python视频教程) 用户可以通过电子邮件,Dropbox,GitHub 和 Jupyter Notebook Viewer,将 Jupyter Notebook 分享给其他人。 在Jupyter Notebook 中,代码可以实时的生成图像,视频,LaTeX和JavaScript。 使用 数据挖掘领域中最热门的比赛 Kaggle 里的资料都是Jupyter 格式 。 架构 Jupyter组件 Jupyter包含以下组件: Jupyter Notebook 和 ……
本文实例讲述了Python实现的微信好友数据分析功能。分享给大家供大家参考,具体如下: 这里主要利用python对个人微信好友进行分析并把结果输出到一个html文档当中,主要用到的python包为 itchat , pandas , pyecharts 等 1、安装itchat 微信的python sdk,用来获取个人好友关系。获取的代码 如下: import itchatimport pandas as pdfrom pyecharts import Geo, Baritchatlogin()friends = itchatget_friends(update=True)[0:]def User2dict(User): User_dict = {} User_dict["NickName"] = User["NickName"] if User["NickName"] else "NaN" User_dict["City"] = User["City"] if User["City"] else "NaN" User_dict["Sex"] = User["Sex"] if User["Sex"] else 0 User_dict["Signature"] = User["Signature"] if User["Signature"] else "NaN" ……
基于微信开放的个人号接口python库itchat,实现对微信好友的获取,并对省份、性别、微信签名做数据分析。 效果: 直接上代码,建三个空文本文件stopwordstxt,newdittxt、unionWordstxt,下载字体simheittf或删除字体要求的代码,就可以直接运行。 #wxfriendspy 2018-07-09import itchatimport sysimport pandas as pdimport matplotlibpyplot as pltpltrcParams['fontsans-serif']=['SimHei']#绘图时可以显示中文pltrcParams['axesunicode_minus']=False#绘图时可以显示中文import jiebaimport jiebaposseg as psegfrom scipymisc import imreadfrom wordcloud import WordCloudfrom os import path#解决编码问题non_bmp_map = dictfromkeys(range(0x10000, sysmaxunicode + 1), 0xfffd) #获取好友信息def getFriends():……
Python数据分析之双色球基于线性回归算法预测下期中奖结果示例
本文实例讲述了Python数据分析之双色球基于线性回归算法预测下期中奖结果。分享给大家供大家参考,具体如下: 前面讲述了关于双色球的各种算法,这里将进行下期双色球号码的预测,想想有些小激动啊。 代码中使用了线性回归算法,这个场景使用这个算法,预测效果一般,各位可以考虑使用其他算法尝试结果。 发现之前有很多代码都是重复的工作,为了让代码看的更优雅,定义了函数,去调用,顿时高大上了 #!/usr/bin/python# -- coding:UTF-8 --#导入需要的包import pandas as pdimport numpy as npimport matplotlibpyplot as pltimport operatorfrom sklearn import datasets,linear_modelfrom sklearnlinear_model import LogisticRegression#读取文件d……
以上就是本次介绍的Python数据电子书的全部相关内容,希望我们整理的资源能够帮助到大家,感谢大家对鬼鬼的支持。
注·获取方式:私信(666)
可以。
使用pyecharts进行数据可视化。可以在pycharm软件里进行下载pyecharts库包,可以查看pyecharts的中文官网介绍查看一般的使用方法。
大数据分析的前瞻性使得很多公司以及企业都开始使用大数据分析对公司的决策做出帮助,而大数据分析是去分析海量的数据,所以就不得不借助一些工具去分析大数据,。一般来说,数据分析工作中都是有很多层次的,这些层次分别是数据存储层、数据报表层、数据分析层、数据展现层。对于不同的层次是有不同的工具进行工作的。下面小编就对大数据分析工具给大家好好介绍一下。
首先我们从数据存储来讲数据分析的工具。我们在分析数据的时候首先需要存储数据,数据的存储是一个非常重要的事情,如果懂得数据库技术,并且能够 *** 作好数据库技术,这就能够提高数据分析的效率。而数据存储的工具主要是以下的工具。
1、MySQL数据库,这个对于部门级或者互联网的数据库应用是必要的,这个时候关键掌握数据库的库结构和SQL语言的数据查询能力。
2、SQL Server的最新版本,对中小企业,一些大型企业也可以采用SQL Server数据库,其实这个时候本身除了数据存储,也包括了数据报表和数据分析了,甚至数据挖掘工具都在其中了。
3、DB2,Oracle数据库都是大型数据库了,主要是企业级,特别是大型企业或者对数据海量存储需求的就是必须的了,一般大型数据库公司都提供非常好的数据整合应用平台;
接着说数据报表层。一般来说,当企业存储了数据后,首先要解决报表的问题。解决报表的问题才能够正确的分析好数据库。关于数据报表所用到的数据分析工具就是以下的工具。
1、Crystal Report水晶报表,Bill报表,这都是全球最流行的报表工具,非常规范的报表设计思想,早期商业智能其实大部分人的理解就是报表系统,不借助IT技术人员就可以获取企业各种信息——报表。
2、Tableau软件,这个软件是近年来非常棒的一个软件,当然它已经不是单纯的数据报表软件了,而是更为可视化的数据分析软件,因为很多人经常用它来从数据库中进行报表和可视化分析。
第三说的是数据分析层。这个层其实有很多分析工具,当然我们最常用的就是Excel,我经常用的就是统计分析和数据挖掘工具;
1、Excel软件,首先版本越高越好用这是肯定的;当然对Excel来讲很多人只是掌握了5%Excel功能,Excel功能非常强大,甚至可以完成所有的统计分析工作!但是我也常说,有能力把Excel玩成统计工具不如专门学会统计软件;
2、SPSS软件:当前版本是18,名字也改成了PASW Statistics;我从30开始Dos环境下编程分析,到现在版本的变迁也可以看出SPSS社会科学统计软件包的变化,从重视医学、化学等开始越来越重视商业分析,现在已经成为了预测分析软件。
最后说表现层的软件。一般来说表现层的软件都是很实用的工具。表现层的软件就是下面提到的内容。
1、PowerPoint软件:大部分人都是用PPT写报告。
2、Visio、SmartDraw软件:这些都是非常好用的流程图、营销图表、地图等,而且从这里可以得到很多零件;
3、Swiff Chart软件:制作图表的软件,生成的是Flash
在word中插入文本框而不要图形,可以这么做
打开word,插入文本框,
然后选中文本框,单击格式菜单上的形状轮廓按钮,如图
在形状轮廓中选中边框颜色,删除里面的文字,文本框就出现了,如图
1、Excel
为Excel微软办公套装软件的一个重要的组成部分,它可以进行各种数据的处理、统计分析和辅助决策 *** 作,广泛地应用于管理、统计财经、金融等众多领域。
2、SAS
SAS由美国NORTH CAROLINA州立大学1966年开发的统计分析软件。SAS把数据存取、管理、分析和展现有机地融为一体。SAS提供了从基本统计数的计算到各种试验设计的方差分析,相关回归分析以及多变数分析的多种统计分析过程,几乎囊括了所有最新分析方法。
3、R
R拥有一套完整的数据处理、计算和制图功能。可 *** 纵数据的输入和输出,可实现分支、循环,用户可自定义功能。
4、SPSS
SPSS除了数据录入及部分命令程序等少数输入工作需要键盘键入外,大多数 *** 作可通过鼠标拖曳、点击“菜单”、“按钮”和“对话框”来完成。
5、Tableau Software
Tableau Software用来快速分析、可视化并分享信息。Tableau Desktop 是基于斯坦福大学突破性技术的软件应用程序。它可以以在几分钟内生成美观的图表、坐标图、仪表盘与报告。
以上就是关于python数据分析与应用-Python数据分析与应用 PDF 内部全资料版全部的内容,包括:python数据分析与应用-Python数据分析与应用 PDF 内部全资料版、pyecharts可以实现百万级别数据刷新吗、常见的大数据分析工具有哪些等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)