步骤 *** 作方法如下:
1、环境准兄信备:
a、右击桌面上选择【Open in Terminal】 打开终端。
b、在d出的终端中输入【ipython】进入Python的解释器中,如图1所示。
2、导入所需要的包:
导入羡猛轮实验常用的python包。如图2所示。
【import pandas as pd】pandas用来做数据处理。
【import numpy as np】numpy用来做高维度矩阵运算.
【import matplotlib.pyplot as plt】matplotlib用来做数据可视化。
3、pandas数据写入到csv文件中:
【names = [‘Bob’,’Jessica’,’Mary’,’John’,’Mel’]】创建一个names列知袜表
【 births = [968,155,77,578,973]】创建一个births 列表
【DataSet = list(zip(names,births))】用 zip 函数将这两个列表合并在一起
【DataSet】查看生成的数据
【df = pd.DataFrame(data = DataSet ,columns=[‘Names’,’Births’])】用生成的数据生成一个DataFrame对象
【df】查看生成的dataFrame
将创建的数据写入到/opt/births1880.csv文件中,
【df.to_csv(‘/opt/births1880.csv’, index=False, header=False )】将df写入到文件中
【ls /opt/births1880.csv】查看文件是否存在
【cat /opt/births1880.csv】查看文件内容
4、pandas读取csv中的数据
读取步骤3生成的数据,如图5所示。
【local_data = r’/opt/births1880.csv’】将文件路径赋到变量local_data中
【df2 = pd.read_csv(local_data,header=None)】读取内容赋值到df2
【df2】查看df2的值
【 df3 = pd.read_csv(local_data,header=None,names=[‘names’,’births’])】指定列名字赋值到df3
【df3】查看df3的值
Pandas是Python下一个开源数据分析的库,它提供的数据结构DataFrame极大的简化了数据分析过程中一些繁琐 *** 作,DataFrame是一张多维的表,大家可以把它想象成一张Excel表单或者Sql表。之前这篇文章已经介绍了从各种数据源将原始数据载入到dataframe中,这篇文件介绍怎么将处理好的dataframe中的数据写入到文件和数据库中。
参考资料
博客园.博客园[引用时间2018-1-2]
定义:数据帧 (DataFrame) 是二维数据结构,即数据以行和列的表格方式排列。
特点:
1、 潜在的列是不同的类型
2、 大小可变
3、 标记轴是行和列 (行、列索引)
4、 可以对行和列进行算数运算
1、使用列表创建[]
2、使用字典创建{}
3、 使用数组创建 column行索引,index列索引
1、sheet_name 表格的小表名
2、 把哪一列当作行索引 index_col
3、 set_index("列名") 更改某一列为行索引
4、 reset_index(drop=True) 重置行索引,并把行索引转换为数据列
drop=True 不想要学号,即把行索引租键数据删除
1、读取csv文件
2、 从第I行开始作为列索引
header=None或数字
NONE 说明圆型哪文件里面没有设置列索引,不把第一行当索引了
0,1 行当索引。默认是第0行
3、 加列索引
4、编码 、橘码解析引擎
encoding 编码 默认utf-8 Windows新建文件,gb2312,gbk
engine 解析引擎 c比较快 python支撑更多方法
首先是引入pandas和numpy,这是经常配合使用的两个包,pandas依赖于numpy,引入以后我们可以直接使用np/pd来表示这个两个模块先创建一个时间索引,所谓的索引(index)就是每一行数据的id,可以标识每一行的唯一值
为了快速入门,我们看一下如何创建一个6X4的数据:randn函数用于创建随机数,参数表示行数和列数,dates是上一步创建的索引列
我们还可以使用字典来创建数据框,例如创建一个列名为A的数据框,索引是自动创建的整数
这又是一个字典创建DataFrame的例子
假如字典内的数据长度不同,以最长的数据为准,比如B列有4行:
可以使用dtypes来查看各庆搜梁行的数据格式
接着看一下如何查看数据框中的数据,看一下所有的数据
使用head查看前几行数据(默认是前5行),不过漏世你可以指定前几行
查看前三行数据
使用tail查看后5行数据
查看数据框的索引
查看列名用columns
查看数据值,用values
查看描述性统计,用describe
使用type看一下输出的描述性统计是什么样的数据类型——DataFrame数据
使用T来转置数据,也就是行列转换
对数据进行排序,誉运用到了sort,参数可以指定根据哪一列数据进行排序
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)