a = ['one','two','three']
b = [1,2,3]
english_column = pd.Series(a, name='english')
number_column = pd.Series(b, name='number')
predictions = pd.concat([english_column, number_column], axis=1)
#another way to handle
save = pd.DataFrame({'english':a,'number':b})
save.to_csv('b.txt',index=False,sep='')
遇到如下“没有”索引的文件,处理及其不方便。
可以看到
pandas将第一行处理为了列索引,同时由于表格中的第一格(左上角)不为空,因此从左侧开始的第一列并不为行索引,重新为数据添加了新的行索引,从第二行开始,0为初始第一行。
这里有两个语法是df.reindex()和df.rename()
修改索引完成,但成功出现错误。
添加数据loc是比较方便的做法,但如果第n行有数据,那么new_data将会替换这个数据
new_data=['a','b','c','d']
df.loc[n] = new_data
另一种做法是用append,直接在数据末尾增加一行
data={'a':9,'b':10,'c':11,'d':12}
df.append(data,ignore_index=True)
看看处理结果
data.sort_values(by='列名')
如果该文件已存在可以选择目标表。
使用pandas自带的数据导入向导,右击导入的数据库,浏览打开要导入的csv文件,进行必要的设置,如果该文件已存在,因此可以直接选择目标表。
pandas是基于NumPy的一种工具,该工具是为了解决数据分析任务而创建的。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)