- 一、基本数据结构
- 1.1 列表
- 1.2 元组
- 1.3 字典
- 1.4 集合
- 二、pandas库
- 2.1 Series和DataFrame
- 2.2 查找数据
- 2.3 汇总和计算描述统计
- 2.4 常用属性、方法和函数
- 2.5 groupby函数
- 2.6 对连续数据进行分箱
- 2.7 缺失值的处理
- 2.8 数据转换
- 2.9 stack和unstack
- 2.10 处理时间序列数据
- 2.11 可视化
- 三、numpy库
- 3.1 生成随机数
- 3.2 数据探索性分析
- 3.3 拼接数据
- 3.4 多维数组
- 3.5 通用函数
- 3.6 向量化函数
- 3.7 矩阵 *** 作
- 四、其它
- 4.1 lambda函数
- 4.2 错误和异常处理
- 4.3 数据清洗之字符串 *** 作和正则表达式
数据结构之列表
包括列表的排序、zip
函数、交集、并集等。
数据结构之元组
包括元组的创建和常用方法(count
方法)
数据结构之字典
包括字典的创建和 *** 作(访问、插入、替换、检查、删除等)
1.4 集合数据结构之集合
包括集合的创建和 *** 作
二、pandas库 2.1 Series和DataFramepandas之数据结构介绍
包括Series
和DataFrame
的创建方法
pandas之查找数据
包括使用loc
和iloc
方法来查找dataframe中的数据
pandas之汇总和计算描述统计
包括求和、方差、平均值、相关系数、协方差矩阵、去重、值计数等
2.4 常用属性、方法和函数pandas之常用属性、方法和函数
包括sort_index
、sort_values
、rank
、merge
、concat
、reset_index()
、rename()
、reindex()
等
pandas之groupby函数
包括groupby
函数的各个参数、agg()
、apply()
和transform()
pandas之分箱 *** 作
包括用cut
函数和qcut
函数实现等宽法和等频法
数据清洗之处理缺失值
包括缺失值的表示、删除和填充
2.8 数据转换数据处理之数据转换
包括对重复值的删除、替换等
2.9 stack和unstackpandas之stack和unstack
包括stack
和unstack
的用法
pandas之处理时间序列数据
包括字符串与datetime的相互转换、datetime作为索引时的一些方法等
2.11 可视化可视化之基础设置
可视化之用pandas绘制简单的图形
三、numpy库 3.1 生成随机数numpy之生成随机数
包括生成均匀分布、正态分布、指数分布、二项分布、bootstrap抽样等
3.2 数据探索性分析numpy之数据探索性分析
检验几组数据的方差是否相等
包括计算分位数、方差、SW检验、KS检验、t检验、检验方差齐性等
3.3 拼接数据numpy之用concatenate()拼接数据
3.4 多维数组numpy之多维数组
包括数组的建立、索引(含布尔索引)和切片
3.5 通用函数numpy之通用函数
包括计算平方根、乘、除等 *** 作
3.6 向量化函数添加链接描述
包括 where
函数、布尔数组、排序函数等
numpy之矩阵 *** 作
包含矩阵的点乘、特征值、特征向量等
四、其它 4.1 lambda函数lambda函数
4.2 错误和异常处理错误和异常处理
4.3 数据清洗之字符串 *** 作和正则表达式数据清洗之字符串 *** 作和正则表达式
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)