处理pandas吧整数读取成了字符串

处理pandas吧整数读取成了字符串,第1张

处理pandas吧整数读取成了字符串 背景

        在处理下载后的数据,由于下载的格式不统一,导致难以进行,原始数据如下

       

       

问题

        用 如下代码读取,但是第一列莫名其妙了字符串

import pandas as pd

data = pd.read_csv(r"D:chorm下载datasetvowelvowel.dat",sep=" ",header=None)
X = data.iloc[0:846,0:18].values
Y= data.iloc[0:846,18]

# 将字符类型的类别进行整数编码
dicta = {'bus':1, 'opel':2, 'saab':3, 'van':4}
Y = list(map(lambda x : dicta[x],Y))

       

       

解决办法

        加一行 X[:,0] = X[:,0].astype(float) 把字符串转成浮点数

import pandas as pd

data = pd.read_csv(r"D:chorm下载datasetvowelvowel.dat",sep=" ",header=None)
X = data.iloc[0:846,0:18].values
Y= data.iloc[0:846,18]

X[:,0] = X[:,0].astype(float)  ## 把字符串转成浮点数
# 将字符类型的类别进行整数编码
dicta = {'bus':1, 'opel':2, 'saab':3, 'van':4}
Y = list(map(lambda x : dicta[x],Y))

       

       

后记

        问题是解决了,但是为什么会出现第一行有这种奇怪的事发生呢,还需要探究下

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5480730.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-12
下一篇 2022-12-12

发表评论

登录后才能评论

评论列表(0条)

保存