利用Python将图像与xml标签同步分割_python

文章目录

本文主要内容
一、代码内容
二、使用需要修改部分
- 1. 数据标注种类修改
- 2. 修改数据路径以及裁剪图像值
- 3.测试效果

本文主要内容

本文可实现图像与xml格式标签同步分割，文中代码参考自网络。裁剪图像部分见上篇文章：基于Python的有重叠区域的批量图像分割

一、代码内容

import cv2
import os
from xml.dom.minidom import Document
import xml.etree.ElementTree as et

category_set = ['airplane', 'airport', 'baseballfield', 'basketballcourt', 'bridge', 'chimney',
                'dam', 'Expressway-Service-area', 'Expressway-toll-station', 'golffield',
                'groundtrackfield', 'harbor', 'overpass', 'ship', 'stadium', 'storagetank',
                'tenniscourt', 'trainstation', 'vehicle', 'windmill']

path = 'images_split/'  # 图像数据集的路径
path_txt = 'labels/'  # 原数据集标签文件
path_out = 'split_label/'  # 切割后数据集的标签文件存放路径
z=800
#size_w=800
ims_list=os.listdir(path)  # 所有图像文件名集合
for im_list in ims_list:
    img = cv2.imread(path + '/' + im_list)
    img_size = img.shape
    name_list = []
    name = im_list[:-4]
    name_list = name.split('_')
    #print(name_list)
    #print(len(name_list))  # 3
    if len(name) < 3:
        continue  # 结束本次循环
    y = int(name_list[1])  #
    #print("原点纵轴坐标为:", y)
    x = int(name_list[2])  #
    #print("原点横轴坐标为:", x)
    xmlpath = path_txt + name_list[0] + '.xml'
    #print('原xml文件名为：', xmlpath)
    xml_outpath = path_out + name + '.xml'
    #print('分割后xml文件名为：', xml_outpath)

    # 获取原xml文件信息
    tree = et.parse(xmlpath)
    root = tree.getroot()  # 获取根节点
    pngname = root.find('filename').text

    origin_width = root.find('size').find('width').text
    origin_height = root.find('size').find('height').text
    origin_depth = root.find('size').find('depth').text
    # 创建新的xml文件
    # 1. 创建document对象
    doc = Document()
    # 2.创建annotation节点
    annotation = doc.createElement('annotation')
    doc.appendChild(annotation)  # 将annotation添加到doc对象中
    # 3. 创建folder节点，添加至annotation中
    folder = doc.createElement('folder')
    annotation.appendChild(folder)
    folder_txt = doc.createTextNode("test")
    folder.appendChild(folder_txt)
    # 4. 创建filename节点，添加至annotation中
    filename = doc.createElement('filename')
    annotation.appendChild(filename)
    filename_txt = doc.createTextNode(pngname)
    filename.appendChild(filename_txt)
    # 5. 创建size节点，添加到annotation中
    size = doc.createElement('size')
    annotation.appendChild(size)
    # 6.在size节点中，添加width，height，depth属性
    width = doc.createElement('width')
    size.appendChild(width)
    width_txt = doc.createTextNode(str(img_size[0]))
    width.appendChild(width_txt)

    height = doc.createElement('height')
    size.appendChild(height)
    height_txt = doc.createTextNode(str(img_size[1]))
    height.appendChild(height_txt)

    depth = doc.createElement('depth')
    size.appendChild(depth)
    depth_txt = doc.createTextNode(str(origin_depth))
    depth.appendChild(depth_txt)
    with open(xml_outpath, 'wb') as f:
        f.write(doc.toprettyxml(indent='\t', encoding='utf-8'))


    for Object in root.findall('object'):
        label_name = Object.find('name').text
        # print(name)
        bndbox = Object.find('bndbox')
        xmin = int(bndbox.find('xmin').text)
        ymin = int(bndbox.find('ymin').text)
        xmax = int(bndbox.find('xmax').text)
        ymax = int(bndbox.find('ymax').text)
        # print(xmin, ymin, xmax, ymax)
        if x <= xmin <= x + z and x <= xmax <= x + z and y <= ymin <= y + z and y <= ymax <= y + z:
            print(Object.find('name').text)
            print('原标签的xmin, xmax, ymin，ymax分别为：', xmin, xmax, ymin, ymax)
            new_xmin = xmin - x
            new_xmax = xmax - x
            new_ymin = ymin - y
            new_ymax = ymax - y
            print('分割后的new_xmin, new_xmax, new_ymin，new_ymax分别为：', new_xmin, new_xmax, new_ymin, new_ymax)

            # 在新的xml文件中创建object节点
            object_new = doc.createElement("object")
            annotation.appendChild(object_new)

            # 在object节点中添加name，pose，truncated，difficult节点
            name = doc.createElement('name')
            object_new.appendChild(name)
            name_txt = doc.createTextNode(str(label_name))
            name.appendChild(name_txt)

            pose = doc.createElement('pose')
            object_new.appendChild(pose)
            pose_txt = doc.createTextNode("Unspecified")
            pose.appendChild(pose_txt)

            truncated = doc.createElement('truncated')
            object_new.appendChild(truncated)
            truncated_txt = doc.createTextNode("0")
            truncated.appendChild(truncated_txt)

            difficult = doc.createElement('difficult')
            object_new.appendChild(difficult)
            difficult_txt = doc.createTextNode("0")
            difficult.appendChild(difficult_txt)
            # 在object节点中添加bndbox节点
            bndbox = doc.createElement('bndbox')
            object_new.appendChild(bndbox)

            xmin = doc.createElement('xmin')
            bndbox.appendChild(xmin)
            xmin_txt = doc.createTextNode(str(new_xmin))
            xmin.appendChild(xmin_txt)

            ymin = doc.createElement('ymin')
            bndbox.appendChild(ymin)
            ymin_txt = doc.createTextNode(str(new_ymin))
            ymin.appendChild(ymin_txt)

            xmax = doc.createElement('xmax')
            bndbox.appendChild(xmax)
            xmax_txt = doc.createTextNode(str(new_xmax))
            xmax.appendChild(xmax_txt)

            ymax = doc.createElement('ymax')
            bndbox.appendChild(ymax)
            ymax_txt = doc.createTextNode(str(new_ymax))
            ymax.appendChild(ymax_txt)
            with open(xml_outpath, 'wb') as f:
                f.write(doc.toprettyxml(indent='\t', encoding='utf-8'))
            f.close()

二、使用需要修改部分 1. 数据标注种类修改

需将 5-8 行中 category_set修改为自己的类别。此处我设置的为DIOR数据集的类别。

category_set = ['airplane', 'airport', 'baseballfield', 'basketballcourt', 'bridge', 'chimney',
                'dam', 'Expressway-Service-area', 'Expressway-toll-station', 'golffield',
                'groundtrackfield', 'harbor', 'overpass', 'ship', 'stadium', 'storagetank',
                'tenniscourt', 'trainstation', 'vehicle', 'windmill']

2. 修改数据路径以及裁剪图像值

将path设置为分割后的图像路径，path_txt设置为原图像的标注文件路径，path_out设置为分割后的标注存储路径。z值修改为你图像分割后的值。

path = 'images_split/'  # 图像数据集的路径
path_txt = 'labels/'  # 原数据集标签文件
path_out = 'split_label/'  # 切割后数据集的标签文件存放路径
z = 800

3.测试效果

可利用以下代码测试分割后的xml标注与图像是否正确，以下代码参考自网络。其中需要修改 39 - 42 行的imgs_path（分割后的图像路径），xmls_path（分割后的图像标注路径）与labelled_path（显示标注结果的的图像路径）3 个参数。

"""
目的：将原图片(img)与其xml(xml)，合成为打标记的图片(labelled)，矩形框标记用红色即可
已有：（1）原图片文件夹(imgs_path)，（2）xml文件夹(xmls_path)
思路：
    step1: 读取（原图片文件夹中的）一张图片
    step2: 读取（xmls_path）该图片的xml文件，并获取其矩形框的两个对角顶点的位置
    step3: 依据矩形框顶点坐标，在该图片中画出该矩形框
    step4: 图片另存为'原文件名'+'_labelled'，存在‘lablled’文件夹中
"""
import os
import cv2 as cv
import xml.etree.ElementTree as ET


def xml_jpg2labelled(imgs_path, xmls_path, labelled_path):
    imgs_list = os.listdir(imgs_path)
    xmls_list = os.listdir(xmls_path)
    nums = len(imgs_list)
    for i in range(nums):
        img_path = os.path.join(imgs_path, imgs_list[i])
        xml_path = os.path.join(xmls_path, xmls_list[i])
        img = cv.imread(img_path)
        labelled = img
        root = ET.parse(xml_path).getroot()
        objects = root.findall('object')
        for obj in objects:
            bbox = obj.find('bndbox')
            xmin = int(float(bbox.find('xmin').text.strip()))
            ymin = int(float(bbox.find('ymin').text.strip()))
            xmax = int(float(bbox.find('xmax').text.strip()))
            ymax = int(float(bbox.find('ymax').text.strip()))
            labelled = cv.rectangle(labelled, (xmin, ymin), (xmax, ymax), (0, 0, 255), 1)
        cv.imwrite('%s%s_labelled.png' % (labelled_path, imgs_list[i]), labelled)
        # cv.imshow('labelled', labelled)
        # cv.imshow('origin', origin)
        # cv.waitKey()


if __name__ == '__main__':
    imgs_path = 'images_split/'
    xmls_path = 'split_label/'
    labelled_path = 'output/'
    xml_jpg2labelled(imgs_path, xmls_path, labelled_path)

欢迎分享，转载请注明来源：内存溢出

原文地址: https://outofmemory.cn/langs/918620.html

利用Python将图像与xml标签同步分割

发表评论

评论列表（0条）