import pandas as pd #1:读取指定行 print("----读取指定的单行,数据会存在列表里面----") df=pd.read_csv('测试.dat')# data=df.loc[0].values#0表示第一行 这里读取数据并不包含表头,要注意哦! print("读取指定行的数据:n{0}".format(data)) print("n------读取指定的多行,数据会存在嵌套的列表里面----------") df=pd.read_csv('测试.xlsx') data=df.loc[[1,2]].values#读取指定多行的话,就要在loc[]里面嵌套列表指定行数 print("读取指定行的数据:n{0}".format(data)) print("n----------------读取指定的行列-----------------------") df=pd.read_csv('测试.xlsx') data=df.iloc[1,2]#读取第一行第二列的值,这里不需要嵌套列表 print("读取指定行的数据:n{0}".format(data)) print("n----------------读取指定的多行多列值-----------------------") df=pd.read_csv('测试.xlsx') data=df.loc[[1,2],['title','data']].values#读取第一行第二行的title以及data列的值,这里需要嵌套列表 print("读取指定行的数据:n{0}".format(data)) print("n-----------获取所有行的指定列----------------------------") df=pd.read_csv('测试.xlsx') data=df.loc[:,['title','data']].values#读所有行的title以及data列的值,这里需要嵌套列表 print("读取指定行的数据:n{0}".format(data)) print("n------------获取行号并打印输出---------------------------") df=pd.read_csv('测试.xlsx') print("输出行号列表",df.index.values) print("n-------------获取列名并打印输出--------------------------") df=pd.read_csv('测试.xlsx') print("输出列标题",df.columns.values) print("n------------获取指定行数的值---------------------------") df=pd.read_csv('测试.xlsx') print("输出值",df.sample(3).values)#这个方法类似于head()方法以及df.values方法 print("n-----------获取指定列的值----------------------------") df=pd.read_csv('测试.xlsx') print("输出值n",df['data'].values)
#获取总行数 lines=df.shape[0] #查看各列数据类型 print(df.dtypes)
#读取dat文件 #delimiter:读取具有分隔符的数据 #dtype:第0,5,19列以字符串格式读取 pd.read_csv('xxx.dat',header=None,encoding='utf-8',delimiter='|',quoting=3,low_memory=False,dtype = {0:str,5:str,19:str})
#写入dat文件 #index=0:索引不写入 #sep='|':写入具有分隔符的数据 df.to_csv('xxx.dat',header=None,encoding='utf-8',sep='|',quoting=3,index=0)
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)