涉及pandas和文件IO和正则Re:
手动在项目路径下新建“下载21.11.12纽约时报-时间正文的文章”文件夹
import pandas as pd import re data = pd.Dataframe(pd.read_excel('纽约时报.xlsx', 'Sheet1')) #print(data)# 查看读取数据内容 # print(data.values[0:, 0])#取第一列 # print(data.values[0:,1])#取第2列 # #print(data.iloc[0].at['正文']#取一个空格 row = 0 i=1 for row in range(len(data)): column_str = str(data.iloc[row].at['时间'])+"n"+"n"+str(data.iloc[row].at['正文']) #print(column_str) #print(type(column_str)) with open("./"+"下载21.11.12纽约时报-时间正文的文章"+"/" +re.sub(r'[/:*"<>|?n]*', '',str(data.iloc[row].at['Title'])) +".txt", "w",encoding="utf-8") as f: print("正在保存txt" ) f.write(column_str) print("已保存txt" ) i+=1 f.close()
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)