原始数据dataframe
常规 *** 作
#判断整个df中是否存在空值
print(data.isnull().any())
#判断某列中是否存在空值
print(data['成交金额(万元)'].isnull().any())
#查看每列数据类型
print(data.dtypes)
#将成交金额从object类型转为可计算的float
data['成交金额(万元)'] = data['成交金额(万元)'].str.replace(',', '').astype(np.float64)
#查找某列中最大的3个值
max3 = data.nlargest(3, '成交金额(万元)', keep='all')
#查找某列最小值
print(data['成交金额(万元)'].min())
#统计指标(max,min,count,mean等)
print(data['成交金额(万元)'].describe())
数据分组
在这里插入代码片
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)