python实现对图片的一些简单处理_随笔

python实现对图片的一些简单处理

在进行手写数字识别的练习时，总感觉少点什么，每次都是使用mnist数据集，后来突发奇想，能不能用mnist训练出来的模型来识别自己所写的数字？想到这里，便开始 *** 作起来。这里简单写一下如恶化通过python简单的把自己写的数字转换为1通道，28×28维的数据。

首先：实现过程中需要导入两个库，一个是Numpy，另一个是从PIL导入Image。代码如下：

import numpy as np
from PIL import Image

然后：拍一张自己写的数字，如下图所示：

这里将图片导入到电脑后，需要知道图片在电脑中存储的位置，我这里保存在D盘，具体的位置是：D:Myone.jpg

接下来使用Image库，将这个图片导入进去，并对图片进行更改像素和灰度处理，具体代码如下：

origin = Image.open('D:Myone.jpg')  # 从D盘中导入图片
origin_decrease = origin.resize((28, 28), Image.ANTIALIAS)  # 将图片更改为28×28像素，3通道的图像
output = origin_decrease.convert("L")  # 对图像进行灰度处理，处理完之后的图像像素为：28×28，通道为：1

进行完这一步之后，图片变为下图所示：

下一步，将图片信息保存为Numpy数组的形式：

output_arr = np.array(output)  # 将图片信息保存为Numpy数组

这时，发现的问题是：mnist手写数字里背景为黑色，手写的部分为白色，所以我们通过下面的处理，将图片设置为与mnist手写数字相同的背景和颜色。

threshold = 140
argument = []
for i in range(256):
    if i < threshold:
        argument.append(1)
    else:
        argument.append(0)

photo = output.point(argument, '1')

显示photo，可以发现，图像变为了与mnist数据库图像具有相同形式。

到这里后，发现虽然图片形式相同，但是数据形式是28×28的二维形式，而mnist数据集的数据保存形式是1通道的三维形式，即：1×28×28，所以，进一步，将数据形式转换为与mnist数据集格式相同的形式。

photo_arg = np.array(photo)
pho = np.random.randn(1, 28, 28)
pho[0, :, :] = photo_arg

最后，得到的图像pho的数据形式就与mnist数据形式相同了。

欢迎分享，转载请注明来源：内存溢出

原文地址: https://outofmemory.cn/zaji/5679650.html

python实现对图片的一些简单处理

发表评论

评论列表（0条）