- 创建指定长度或形状的全为0的ndarray数组;
- 在默认情况下,创建的数组元素类型为浮点型,如果要使用其他类型可以设置dtype参数返回给定类型的新数组;
- 语法结构:
import numpy as np np.zeros(shape, dtype=float, orser='c')
- shape:定义返回对俄数组的形状;
- 创建多维数组时,用括号将shape数据组括起来;
- dtype:生成数组的数据类型,默认为np.float64
- order:可选参数,{‘c’, ‘f’},表示是否在内容中以行列顺序存储多维数据;
- shape:定义返回对俄数组的形状;
使用独热编码对数据信息进行存储:
import numpy as np
import matplotlib.pyplot as plt
import matplotlib
import pandas as pd
import sklearn
df = pd.DataFrame({"num":["A, C, D", "H, A, B", "C, B, F", "S, A, L"]})
temp_list = df["num"].str.split(", ").tolist()
num_list = list(sorted(set([i for j in temp_list for i in j])))
zeros_df = pd.DataFrame(np.zeros((df.shape[0], len(num_list))), dtype=np.int16, columns=num_list)
for i in range(df.shape[0]):
zeros_df.loc[i, temp_list[i]] = 1
print(zeros_df)
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)