如何将pandas.dataframe的数据写入到文件中

如何将pandas.dataframe的数据写入到文件中,第1张

步骤 *** 作方法如下:

1、环境准兄信备:

a、右击桌面上选择【Open in Terminal】 打开终端。

b、在d出的终端中输入【ipython】进入Python的解释器中,如图1所示。

2、导入所需要的包:

导入羡猛轮实验常用的python包。如图2所示。

【import pandas as pd】pandas用来做数据处理。

【import numpy as np】numpy用来做高维度矩阵运算.

【import matplotlib.pyplot as plt】matplotlib用来做数据可视化。

3、pandas数据写入到csv文件中:

【names = [‘Bob’,’Jessica’,’Mary’,’John’,’Mel’]】创建一个names列知袜表

【 births = [968,155,77,578,973]】创建一个births 列表

【DataSet = list(zip(names,births))】用 zip 函数将这两个列表合并在一起

【DataSet】查看生成的数据

【df = pd.DataFrame(data = DataSet ,columns=[‘Names’,’Births’])】用生成的数据生成一个DataFrame对象

【df】查看生成的dataFrame

将创建的数据写入到/opt/births1880.csv文件中,

【df.to_csv(‘/opt/births1880.csv’, index=False, header=False )】将df写入到文件中

【ls /opt/births1880.csv】查看文件是否存在

【cat /opt/births1880.csv】查看文件内容

4、pandas读取csv中的数据

读取步骤3生成的数据,如图5所示。

【local_data = r’/opt/births1880.csv’】将文件路径赋到变量local_data中

【df2 = pd.read_csv(local_data,header=None)】读取内容赋值到df2

【df2】查看df2的值

【 df3 = pd.read_csv(local_data,header=None,names=[‘names’,’births’])】指定列名字赋值到df3

【df3】查看df3的值

Pandas是Python下一个开源数据分析的库,它提供的数据结构DataFrame极大的简化了数据分析过程中一些繁琐 *** 作,DataFrame是一张多维的表,大家可以把它想象成一张Excel表单或者Sql表。之前这篇文章已经介绍了从各种数据源将原始数据载入到dataframe中,这篇文件介绍怎么将处理好的dataframe中的数据写入到文件和数据库中。

参考资料

博客园.博客园[引用时间2018-1-2]

定义:数据帧 (DataFrame) 是二维数据结构,即数据以行和列的表格方式排列。

特点:

1、 潜在的列是不同的类型

2、 大小可变

3、 标记轴是行和列 (行、列索引)

4、 可以对行和列进行算数运算

1、使用列表创建[]

2、使用字典创建{}

3、 使用数组创建 column行索引,index列索引

1、sheet_name 表格的小表名

2、 把哪一列当作行索引 index_col

3、 set_index("列名") 更改某一列为行索引

4、 reset_index(drop=True) 重置行索引,并把行索引转换为数据列

drop=True 不想要学号,即把行索引租键数据删除

1、读取csv文件

2、 从第I行开始作为列索引

header=None或数字

NONE 说明圆型哪文件里面没有设置列索引,不把第一行当索引了

0,1 行当索引。默认是第0行

3、 加列索引

4、编码 、橘码解析引擎

encoding 编码 默认utf-8 Windows新建文件,gb2312,gbk

engine 解析引擎 c比较快 python支撑更多方法

首先是引入pandas和numpy,这是经常配合使用的两个包,pandas依赖于numpy,引入以后我们可以直接使用np/pd来表示这个两个模块

先创建一个时间索引,所谓的索引(index)就是每一行数据的id,可以标识每一行的唯一值

为了快速入门,我们看一下如何创建一个6X4的数据:randn函数用于创建随机数,参数表示行数和列数,dates是上一步创建的索引列

我们还可以使用字典来创建数据框,例如创建一个列名为A的数据框,索引是自动创建的整数

这又是一个字典创建DataFrame的例子

假如字典内的数据长度不同,以最长的数据为准,比如B列有4行:

可以使用dtypes来查看各庆搜梁行的数据格式

接着看一下如何查看数据框中的数据,看一下所有的数据

使用head查看前几行数据(默认是前5行),不过漏世你可以指定前几行

查看前三行数据

使用tail查看后5行数据

查看数据框的索引

查看列名用columns

查看数据值,用values

查看描述性统计,用describe

使用type看一下输出的描述性统计是什么样的数据类型——DataFrame数据

使用T来转置数据,也就是行列转换

对数据进行排序,誉运用到了sort,参数可以指定根据哪一列数据进行排序


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/tougao/12229970.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-22
下一篇 2023-05-22

发表评论

登录后才能评论

评论列表(0条)

保存