1.
os.walk
os.walk()返回一个三元素的tuple:当前路径、子文件夹名称、文件列表。>>>
import
os>>>
def
fun(
path
):...
for
root,
dirs,
files
in
os.walk(
path
):...
for
fn
in
files:...
root,
fn...
>>>
fun(
r'C:\TDDOWNLOAD'
)C:\TDDOWNLOAD
a.txtC:\TDDOWNLOAD
b.txtC:\TDDOWNLOAD\sub1
c.txtC:\TDDOWNLOAD\sub1
d.txt>>>
2.
glob.glob
glob.glob()只接受一个参数,这个参数既代有路径,又代有匹配模式,返回值为一个列表。注意,glob.glob()无法直接穿透子文件夹,需要自己处理:>>>
def
fun(
path
):...
for
fn
in
glob.glob(
path
+
os.sep
+
'*'
):
#
'*'代表匹配所有文件...
if
os.path.isdir(
fn
):
#
如果结果为文件夹...
fun(
fn
)
#
递归...
else:...
fn...
>>>
fun(
r'C:\TDDOWNLOAD'
)C:\TDDOWNLOAD\a.txtC:\TDDOWNLOAD\b.txtC:\TDDOWNLOAD\sub1\c.txtC:\TDDOWNLOAD\sub1\d.txt>>>
'*'为悄喊喊匹配渗握模式,代表匹配所启野有文件,只有这样才能将子文件夹查出来,以便递归深入,探查下一层的文件。
target_dir = 'home/行租纳' #假定要拷贝到home目录x = [ item for item in os.walk('.') ] #os.walk递归地遍历所有子文件夹
#返回的是一个list,档没list中每一个元素由3个部分:(path, dirs, files)
for path, dirs, files in x:
for file in files:
if file.endswith('.txt'): #找到以txt结尾的,copy之型档
shutil.copy( path+os.sep+file , target_dir )
伪代码:
1、遍历文件物告夹下所有txt文件
rootdir = '/path/to/xx/dir' # 文件夹路径for parent, 漏悔dirnames, filenames in os.walk(rootdir):
for filename in filenames:
2、读取txt文件里的内容,通过正则表达式把txt里多篇文章拆分开来。得到一个列表:['{xx1}##NO', '{xx2}', '{xx3}##NO']
3、把上面得到的list写到一个新罩搜明的临时文件里,比如:xx_tmp.txt,然后:shutil.move('xx_tmp.txt', 'xx.txt') 覆盖掉原来的文件
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)