处理数据集:整理为特征文件.txt和标签文件.txt

处理数据集:整理为特征文件.txt和标签文件.txt,第1张

处理数据集:整理为特征文件.txt和标签文件.txt Part1:将多个文件夹中的.features文件整合在一个txt文件中

背景:该数据集大文件夹包含六个小文件夹,每个小文件夹代表一个类别,其中包含该类别下图片特征的文件,文件原格式无法用python直接打开,所以在读取前需要一步修改文件后缀的步骤。每个单独的文件内容有六行,是提取的各种特征向量,首先尝试将这六个特征向量作为一个特征向量,所以需要把单独文件中的回车符号去掉,以逗号代替,最后在整个文件的数据后(即一个完整的特征向量后)写入回车符,以方便后面对特征文件的进一步处理。

import os

for filename in os.listdir("kvasir-dataset-v2-features"):
    for filename2 in os.listdir("kvasir-dataset-v2-features/" + filename):
        portion = os.path.splitext(filename2)  # 分离文件名与扩展名
        if portion[1] == '.features':
            # 重新组合文件名和后缀名
            newname = portion[0] + '.txt'
            os.chdir("kvasir-dataset-v2-features/" + filename)#切换路径
            os.rename(filename2, newname)
            filename2 = newname
            os.chdir("C:/Desktop/itsname")#切换回原路径
        with open("kvasir-dataset-v2-features/"+ filename +  "/"+ filename2) as f:
            for line in f.readlines():
                line=line.strip('n')
                with open("kvasir-dataset-v2-features.txt","a") as all:
                    all.write(line + ",")
        with open("kvasir-dataset-v2-features.txt","a") as all:
                all.write('n')
Part2:提取标签文件
import os

for filename in os.listdir("kvasir-dataset-v2-features"):
    for filename2 in os.listdir("kvasir-dataset-v2-features/" + filename):
        with open("label.txt","a") as all:
            all.write(filename + 'n')
结果:
    结果文件
    特征向量(待修整)
    标签

欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/zaji/5720596.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-18
下一篇 2022-12-18

发表评论

登录后才能评论

评论列表(0条)

保存