常用9类图像数据增强处理方法（可应用于图像分类、目标检测等场景）-附Python源码_python

概述本文将分享下我做图像识别项目工作过程中常用的关于图像分类数据处理方法，如有不当之处，欢迎大家指正。图像数据增强我们做项目过程中，经常会遇到某些类的图像数据出现严重不足，比如低于100张，我们就可以通过现有图像，经过数据增强算法来进行扩充，这里我主要介绍了：增加噪声、图像

本文将分享下我做图像识别项目工作过程中常用的关于图像分类数据处理方法，如有不当之处，欢迎大家指正。

图像数据增强

我们做项目过程中，经常会遇到某些类的图像数据出现严重不足，比如低于100张，我们就可以通过现有图像，经过数据增强算法来进行扩充，这里我主要介绍了：增加噪声、图像变暗/变亮、拉伸图像、旋转图像、水平翻转图像、裁切图像、颜色抖动等图像数据增强方式，供小伙伴们参考。

其实图像数据增强还有很多算法，比如图像变形、图像裁切组合、图像平移、直方图均衡化、gamma变换、滤波和随机噪声等等，小伙伴们在使用过程中可以多试下看哪种增强算法比较适用于自己的模型，再选择使用。

另外在某些图像分类、目标检测、生成对抗网络算法中，为了提高模型的泛化性能，也可以在参数里面设置选择是否进行数据增强，直接使用。

图像数据处理过程中，常用到两个比较强大的图像处理库，可以使用pip直接进行安装。
其中注意opencv库一直在更新，可以按照d出来的提示，修改链接云里面有的版本进行安装。

pip3 install Pillowpip3 install -i https://mirror.aliyun.com/pypi/simple opencv-python==3.4.2.16pip3 install -i https://pypi.tuna.tsinghua.edu.cn/simple opencv-contrib-python==3.4.2.16

import cv2from PIL import Image, ImageEnhanceimport timeimport numpy as npclass Image_enhance():    def __init__(self,rootPath):        self.rootPath = rootPath        self.export_path_base = rootPath[:-4]        self.image = cv2.imread(rootPath)        self.class_name = rootPath.split("\")[-2]    def get_savename(self,operate_name):        """        :param export_path_base: 图像输出路径        :param class_name: 图像label        :param operate_name:  *** 作名字        :return: 返回图像存储名        """        try:            # 获取时间戳，用于区分图像            Now = time.time()            tail_time = str(round(Now * 1000000))[-4:]  # 时间戳尾数            head_time = time.strftime("%Y%m%d%H%M%s", time.localtime(time.time()))            # 时间标签            label = str(head_time + tail_time) + '_' + str(operate_name)            # 输出文件夹            export_path_base = self.export_path_base            # 子文件夹以“ *** 作operate”命名            out_path = export_path_base            # 创建子文件夹            # if not os.path.exists(out_path):            #     os.mkdir(out_path)            # 存储完整路径            savename = out_path + '_' + label + ".jpg"            return savename        except Exception as e:            print(e)    def SaltAndPepper(self, percetage=0.2):        """给图片增加椒盐噪声"""        SP_Noiseimg = self.image.copy()        SP_NoiseNum = int(percetage * self.image.shape[0] * self.image.shape[1])        for i in range(SP_NoiseNum):            randR = np.random.randint(0, self.image.shape[0] - 1)            randG = np.random.randint(0, self.image.shape[1] - 1)            randB = np.random.randint(0, 3)            if np.random.randint(0, 1) == 0:                SP_Noiseimg[randR, randG, randB] = 0            else:                SP_Noiseimg[randR, randG, randB] = 255        percetage_name = str(percetage*100).replace('.','')        operate_name = 'SaltAndPepper_' + percetage_name        save_name = self.get_savename(operate_name)        cv2.imwrite(save_name,SP_Noiseimg)        print('{}做数据增强{} 完毕 '.format(self.class_name,operate_name))    def addGaussianNoise(self, percetage=0.2):        """给图片增加高斯噪声"""        G_Noiseimg = self.image.copy()        w = self.image.shape[1]        h = self.image.shape[0]        G_NoiseNum = int(percetage * self.image.shape[0] * self.image.shape[1])        for i in range(G_NoiseNum):            temp_x = np.random.randint(0, h)            temp_y = np.random.randint(0, w)            G_Noiseimg[temp_x][temp_y][np.random.randint(3)] = np.random.randn(1)[0]        percetage_name = str(percetage*100).replace('.','')        operate_name = 'addGaussianNoise_' + percetage_name        save_name = self.get_savename(operate_name)        cv2.imwrite(save_name,G_Noiseimg)        print('{}做数据增强{} 完毕 '.format(self.class_name,operate_name))    def darker(self, percetage=0.87):        """减低图片像素，是图片变昏暗"""        image_darker = self.image.copy()        w = self.image.shape[1]        h = self.image.shape[0]        # get darker        for xi in range(0, w):            for xj in range(0, h):                image_darker[xj, xi, 0] = int(self.image[xj, xi, 0] * percetage)                image_darker[xj, xi, 1] = int(self.image[xj, xi, 1] * percetage)                image_darker[xj, xi, 2] = int(self.image[xj, xi, 2] * percetage)        percetage_name = str(percetage*100).replace('.','')        operate_name = 'darker_' + percetage_name        save_name = self.get_savename(operate_name)        cv2.imwrite(save_name,image_darker)        print('{}做数据增强{} 完毕 '.format(self.class_name, operate_name))    def brighter(self, percetage=1.07):        """增强图片像素，使图片变亮"""        image_brighter= self.image.copy()        w = self.image.shape[1]        h = self.image.shape[0]        # get brighter        for xi in range(0, w):            for xj in range(0, h):                image_brighter[xj, xi, 0] = np.clip(int(self.image[xj, xi, 0] * percetage), a_max=255, a_min=0)                image_brighter[xj, xi, 1] = np.clip(int(self.image[xj, xi, 1] * percetage), a_max=255, a_min=0)                image_brighter[xj, xi, 2] = np.clip(int(self.image[xj, xi, 2] * percetage), a_max=255, a_min=0)        percetage_name = str(percetage*100).replace('.','')        operate_name = 'brighter_' + percetage_name        save_name = self.get_savename(operate_name)        cv2.imwrite(save_name,image_brighter)        print('{}做数据增强{} 完毕 '.format(self.class_name, operate_name))    def rotate(self, angle=15, center=None, scale=1.0):        """按指定角度旋转"""        (h, w) = self.image.shape[:2]        # If no rotation center is specifIEd, the center of the image is set as the rotation center        if center is None:            center = (w / 2, h / 2)        m = cv2.getRotationMatrix2D(center, angle, scale)        rotate_image = cv2.warpAffine(self.image.copy(), m, (w, h))        angle_name = str(angle).replace('.','')        operate_name = 'rotate_' + angle_name        save_name = self.get_savename(operate_name)        cv2.imwrite(save_name,rotate_image)        return save_name    def flip(self):        """水平翻转."""        flipped_image = np.fliplr(self.image.copy())        operate_name = 'flip_'        save_name = self.get_savename(operate_name)        cv2.imwrite(save_name,flipped_image)    def deform(self):        """图像拉伸."""        try:            operate = 'deform_'            # 图像完整路径            rootPath = self.rootPath            with Image.open(rootPath) as image:                w, h = image.size                w = int(w)                h = int(h)                if not w == h:                    # 拉伸成宽为w的正方形                    out_ww = image.resize((int(w), int(w)))                    operate_name_ww = operate + str(w)                    savename_ww = self.get_savename(operate_name_ww)                    out_ww.save(savename_ww, quality=100)                    # 拉伸成宽为h的正方形                    out_hh = image.resize((int(h), int(h)))                    operate_name_hh = operate + str(h)                    savename_hh = self.get_savename(operate_name_hh)                    out_hh.save(savename_hh, quality=100)                else:                    pass            # 日志            # logger.info(operate)        except Exception as e:            # logger.error('ERROR %s', operate)            # logger.error(e)            print(e,"ERROR"+str(operate))    def crop(self,choose):        """提取四个角落和中心区域."""        """:choose 指选择哪种 *** 作，共可以选择五种切割 *** 作"""        try:            operate = 'crop_'            # 图像完整路径            rootPath = self.rootPath            with Image.open(rootPath) as image:                w, h = image.size                # 切割后尺寸                scale = 0.875                # 切割后长宽                ww = int(w * scale)                hh = int(h * scale)                # 图像起点，左上角坐标                x = y = 0                # 切割左上角                if choose =='lu':                    x_lu = x                    y_lu = y                    out_lu = image.crop((x_lu, y_lu, ww, hh))                    operate_lu_name =operate + 'lu'                    savename_lu = self.get_savename(operate_lu_name)                    out_lu.save(savename_lu, quality=100)                # logger.info(operate + '_lu')                # 切割左下角                elif choose =='ld':                    x_ld = int(x)                    y_ld = int(y + (h - hh))                    out_ld = image.crop((x_ld, y_ld, ww, hh))                    operate_ld_name =operate + 'ld'                    savename_ld = self.get_savename(operate_ld_name)                    out_ld.save(savename_ld, quality=100)                # logger.info(operate + '_ld')                # 切割右上角                elif choose =='ru':                    x_ru = int(x + (w - ww))                    y_ru = int(y)                    out_ru = image.crop((x_ru, y_ru, w, hh))                    operate_ru_name =operate + 'ru'                    savename_ru = self.get_savename(operate_ru_name)                    out_ru.save(savename_ru, quality=100)                # logger.info(operate + '_ru')                # 切割右下角                elif choose == 'rd':                    x_rd = int(x + (w - ww))                    y_rd = int(y + (h - hh))                    out_rd = image.crop((x_rd, y_rd, w, h))                    operate_rd_name =operate + 'rd'                    savename_rd = self.get_savename(operate_rd_name)                    out_rd.save(savename_rd, quality=100)                # logger.info(operate + '_rd')                # 切割中心                elif choose == 'ce':                    x_ce = int(x + (w - ww) / 2)                    y_ce = int(y + (h - hh) / 2)                    out_ce = image.crop((x_ce, y_ce, ww, hh))                    operate_ce_name =operate + 'center'                    savename_ce = self.get_savename(operate_ce_name)                    out_ce.save(savename_ce, quality=100)                else:                    xx = ['lu','ld','ru','rd','ce']                    print('未剪切成功，请检查choose选择剪切的参数是否为{}中的一个'.format(xx))                # logger.info('提取中心')        except Exception as e:            # logger.error('ERROR %s', 1)            # logger.error(e)            print(e,"ERROR"+str(operate))    def image_color(self):        """        对图像进行颜色抖动        """        image = Image.open(self.rootPath)        random_factor = np.random.randint(low=0, high=31) / 10.0  # 随机的扰动因子        color_image = ImageEnhance.color(image).enhance(random_factor)  # 调整图像的饱和度        random_factor = np.random.randint(low=10, high=21) / 10.0        bright_image = ImageEnhance.Brightness(color_image).enhance(random_factor)  # 调整图像的亮度        random_factor = np.random.randint(low=10, high=21) / 10.0        contrast_image = ImageEnhance.Contrast(bright_image).enhance(random_factor)  # 调整图像的对比度        random_factor = np.random.randint(low=0, high=31) / 10.0        sharp_image = ImageEnhance.Sharpness(contrast_image).enhance(random_factor)  # 调整图像的锐度        operate_color_name = 'color_'        savename_color = self.get_savename(operate_color_name)        sharp_image.save(savename_color)

本文只供大家学习相关知识使用，不以任何商业盈利为目的，转载或分享请注明相关来源。如涉及到相关侵权，请联系我删除。
欢迎志同道合者互相交流学习，微信：Zhihua_Steven

总结

以上是内存溢出为你收集整理的常用9类图像数据增强处理方法（可应用于图像分类、目标检测等场景）-附Python源码全部内容，希望文章能够帮你解决常用9类图像数据增强处理方法（可应用于图像分类、目标检测等场景）-附Python源码所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错，欢迎将内存溢出网站推荐给程序员好友。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/langs/1188424.html

常用9类图像数据增强处理方法（可应用于图像分类、目标检测等场景）-附Python源码

发表评论

评论列表（0条）