1、先将excel转换为dataframe对象,再获得原字段和原主数据。
2、先考虑columns,遍历各表,利用正则表达式提取表中有效数据作为新表字段作为newcol列表储存。
3、再考虑rows,我们希望为每位学生提供一行存储数据,但是dataframe函数只能一次性读取一张表,所以需要遍历各表提取数据。将一行数据作为一个list,再将该list作为元素追加到newdata中。
4、regex一次性准确提取有效信息难度太大(考虑到该excel的不规范)。clear函数多次清洗数据。
5、将newcol和newdata作为参数传递给to_excel函数,导出xls数据。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)