我们在处理数据时,导出的TXT格式文件后面会有许多空格,我们应怎么去除?
1、将txt导入到xlc表格中点击另存为,存为csv格式
2、接下来就是用pandas *** 作
读取csv数据
import numpy as np
import pandas as pd
import random
train_file = './train12.csv' #导入我们要处理的数据的路径
data=pd.read_csv(train_file,header=None,dtype=object) #对于数据进行可视化
data
将空值填充
data.fillna('A', inplace=True) #先将空类型值填充
导出为txt文件
data.to_csv('train12.txt',sep='\t',index=False, header=None) #导出为txt
3、下面就是文本进行替换 *** 作了
首先将长空格替换为一个空格
然后将‘ A’替换为‘’,也就是将 A删除
得到结果
每行后面的空格都删除了,完工!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)