在进行手写数字识别的练习时,总感觉少点什么,每次都是使用mnist数据集,后来突发奇想,能不能用mnist训练出来的模型来识别自己所写的数字?想到这里,便开始 *** 作起来。这里简单写一下如恶化通过python简单的把自己写的数字转换为1通道,28×28维的数据。
首先:实现过程中需要导入两个库,一个是Numpy,另一个是从PIL导入Image。代码如下:
import numpy as np from PIL import Image
然后:拍一张自己写的数字,如下图所示:
这里将图片导入到电脑后,需要知道图片在电脑中存储的位置,我这里保存在D盘,具体的位置是:D:Myone.jpg
接下来使用Image库,将这个图片导入进去,并对图片进行更改像素和灰度处理,具体代码如下:
origin = Image.open('D:Myone.jpg') # 从D盘中导入图片 origin_decrease = origin.resize((28, 28), Image.ANTIALIAS) # 将图片更改为28×28像素,3通道的图像 output = origin_decrease.convert("L") # 对图像进行灰度处理,处理完之后的图像像素为:28×28,通道为:1
进行完这一步之后,图片变为下图所示:
下一步,将图片信息保存为Numpy数组的形式:
output_arr = np.array(output) # 将图片信息保存为Numpy数组
这时,发现的问题是:mnist手写数字里背景为黑色,手写的部分为白色,所以我们通过下面的处理,将图片设置为与mnist手写数字相同的背景和颜色。
threshold = 140 argument = [] for i in range(256): if i < threshold: argument.append(1) else: argument.append(0) photo = output.point(argument, '1')
显示photo,可以发现,图像变为了与mnist数据库图像具有相同形式。
到这里后,发现虽然图片形式相同,但是数据形式是28×28的二维形式,而mnist数据集的数据保存形式是1通道的三维形式,即:1×28×28,所以,进一步,将数据形式转换为与mnist数据集格式相同的形式。
photo_arg = np.array(photo) pho = np.random.randn(1, 28, 28) pho[0, :, :] = photo_arg
最后,得到的图像pho的数据形式就与mnist数据形式相同了。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)