首先,我们来构造一个 DataFrame :
查询指定列:
使用 loc 和 iloc 查询指定行:
此外, iloc 和 loc 还可以接收一个坐标,查询 DataFrame 的指定值或区域:
最后,还有经常使用的布尔索引:
修改指定值:
修改索引和列名:
增加一行内容:
增加多行内容(纵向拼接两个 DataFrame ),首先构造一个新的 DataFrame df2 :
拼接两个 DataFrame:
pd.concat 只做简单的拼接,即便是索引重复也不会覆盖:
通常,我们会使用 ignore_index=True 来重新生产数字索引:
为 df2 增加一列 DD :
如果是增加多列呢?同样的我们还是使用 pd.concat ,不过要将参数设置为 axis=1 。下面我们先构造一个两行两列的 DataFrame df4 :
拼接 df2 与 df4 :
删除上述 df5 中的 E 列和 F 列:
删除多列时,也可以使用 drop 方法,不过要指定 axis=1 :
也可以使用 drop 方法删除多行,删除行时使用默认参数 axis=0 即可:
#原始数据为2行3列,行标01,列标abcdf = pandas.DataFrame(numpy.random.randn(2, 3), columns=['a', 'b', 'c'])
#增加一列d
df['d'] = pandas.Series(numpy.random.randn(len(df['a'])), index=df.index)
#增加一行2
df.ix[2] = pandas.Series(numpy.random.rand(4),index=df.columns)
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)