python实现对图片的一些简单处理

python实现对图片的一些简单处理,第1张

python实现对图片的一些简单处理

       在进行手写数字识别的练习时,总感觉少点什么,每次都是使用mnist数据集,后来突发奇想,能不能用mnist训练出来的模型来识别自己所写的数字?想到这里,便开始 *** 作起来。这里简单写一下如恶化通过python简单的把自己写的数字转换为1通道,28×28维的数据。

       首先:实现过程中需要导入两个库,一个是Numpy,另一个是从PIL导入Image。代码如下:

import numpy as np
from PIL import Image

        然后:拍一张自己写的数字,如下图所示:

       这里将图片导入到电脑后,需要知道图片在电脑中存储的位置,我这里保存在D盘,具体的位置是:D:Myone.jpg

       接下来使用Image库,将这个图片导入进去,并对图片进行更改像素和灰度处理,具体代码如下:

origin = Image.open('D:Myone.jpg')  # 从D盘中导入图片
origin_decrease = origin.resize((28, 28), Image.ANTIALIAS)  # 将图片更改为28×28像素,3通道的图像
output = origin_decrease.convert("L")  # 对图像进行灰度处理,处理完之后的图像像素为:28×28,通道为:1

       进行完这一步之后,图片变为下图所示:

        下一步,将图片信息保存为Numpy数组的形式

output_arr = np.array(output)  # 将图片信息保存为Numpy数组

      这时,发现的问题是:mnist手写数字里背景为黑色,手写的部分为白色,所以我们通过下面的处理,将图片设置为与mnist手写数字相同的背景和颜色。

threshold = 140
argument = []
for i in range(256):
    if i < threshold:
        argument.append(1)
    else:
        argument.append(0)

photo = output.point(argument, '1')

         显示photo,可以发现,图像变为了与mnist数据库图像具有相同形式。

          到这里后,发现虽然图片形式相同,但是数据形式是28×28的二维形式,而mnist数据集的数据保存形式是1通道的三维形式,即:1×28×28,所以,进一步,将数据形式转换为与mnist数据集格式相同的形式。

photo_arg = np.array(photo)
pho = np.random.randn(1, 28, 28)
pho[0, :, :] = photo_arg

        最后,得到的图像pho的数据形式就与mnist数据形式相同了。

欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/zaji/5679650.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-17
下一篇 2022-12-17

发表评论

登录后才能评论

评论列表(0条)

保存