Series
import pandas as pd
#Series
#data=pd.Series(['阿达','nan','20','2000-10-07'],index=['a','b','c','d']) #行值
# data={'姓名':'张三','性别':'男'} #字典
# data=pd.Series(data)
# print(data['性别'])
# print(data[['姓名','性别']]) #r如果data里面表示的是两个key以上,要用列表的方式表示,类型为pandas中的Series
# list01=['姓名','性别','年龄']
# list02=['张三','男','20']
# data=pd.Series(list02,index=list01) #前面是值,后面是索引
# print(data)
DataFrame
#DataFrame
data=pd.DataFrame([[1,2,3],[4,5,6,],[7,8,9]],columns=['a','b','c'])
# print(data)
#print(data['a'][0]) #前列后行
#print(data.loc[0]['a']) #前行后列
#print(data.iloc[0][0]) #提供绝对位置,前面是行索引,后面是列索引
#print(data[['a','b']]) #输出多列的值
# dict01={
# '姓名':['张三','李四','王五'],
# '年龄':[12,23,41],
# '兴趣':['乒乓球','篮球','足球']
# }
# data=pd.DataFrame(dict01)
# print(data)
# # print(data.columns) #输出列的字段名
# # print(data.index) #输出索引
# #print(data.loc[0]) #返回行数据
# #print(data.loc[1]['姓名']) #先行索引再列索引
# print(data.loc[0:3]) #索引行值,从start开始,到end-1结束
print(data.fillna(0)) #自动填充空值的地方,这里是0
print(data.replace('张三','李四'))
print(data.unique) #查看唯一值,去重
print(data.reset_index(drop=True)) #用户定义的索引值直接被删除,变回默认索引
print(data.reset_index(drop=False)) #索引会被还原成普通列
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)