采购实用python数据处理方法

采购实用python数据处理方法,第1张

正则表达式

匹配多位数字

re.findall(r'\d{n}', str)
# 返回 n 位数字

匹配小数

re.findall(r'\d.+', str)
# 返回小数
list

判断列表是否为空

list == []

len(list) = 0 # ==> []
len(list) > 1 # ==> 非空

a x i s = { 0 , 列 1 , 行 axis= \begin{cases} 0, & \text{列}\ 1,& \text{行} \end{cases} axis={0,1,

从后向前取n个值

arr[-n:]

获取 value 最大元素的 index

aa = [...]
aa.index(max(aa))

迭代函数

enumerate(可迭代对象)
# 生成 index 和 value
pandas

合并

pd.concat([data, pd.DataFrame(columns = blank)], axis = 0) # 增加空白columns

删除指定column为空的行

data.dropna(subset = ['price'])

删除某一列是重复的

df.drop_duplicates(subset = 'label')

判断元素是否为空

pd.isna()

将某一列为空的值取出来

df[df['name'].isnull().values == True]

replace 替换多个

df.replace({'A':100, 'B':50})

排序

df.sort_values(by = ['a'])

删除空白列

df.dropna(axis = 1, how = 'all')
# axis = 0 按行(default)
# axis = 1 按列

# any : 只要有 1 个
# all : 全部都为空才 drop

取最大/最小值的 index

df.idxmax() # 最大值的索引
df.idxmin() # 最小值的索引

使用plotly画 dataframe

import plotly.express as px

px.scatter(data, x = '', y = '') # x 和 y 是 data 中的 columns 
数据类型转换

判断数据类型

isinstance(a, str) # 判断 a 是否为 str型

字符串 ==> 数值

int(str)

ndarry 转 list

aa = np.array([])
bb = aa.tolist()

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/577896.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-04-11
下一篇 2022-04-11

发表评论

登录后才能评论

评论列表(0条)

保存