Ubuntu 14.04 64位机上用Caffe+MNIST训练Lenet网络 *** 作步骤
1.将终端定位到Caffe根目录;
2.下载MNIST数据库并解压缩:$ ./data/mnist/get_mnist.sh
3.将其转换成Lmdb数据库格式:$ ./examples/mnist/create_mnist.sh
执行完此shell脚本后,会在./examples/mnist下增加两个新目录,mnist_test_lmdb和mnist_train_lmdb
4.train model:$ ./examples/mnist/train_lenet.sh
(1)、使用LeNet网络(《Gradient-BasedLearning Applied to Document Recognition》);
(2)、使用./examples/mnist/lenet_train_test.prototxtmodel;
(3)、使用./examples/mnist/lenet_solver.prototxtmodel;
(4)、执行train_lenet.sh脚本,会调用./build/tools目录下的caffe执行文件,此执行文件的实现是./tools目录下的caffe.cpp文件;
(5)、执行此脚本后,会生成几个文件,其中./examples/mnist/lenet_iter_10000.caffemodel则是最终训练生成的model文件;
(6)、以上默认的是在GPU模式下运行,如果想让其在CPU模式下运行,只需将lenet_solver.prototxt文件中的solver_mode字段值由原来的GPU改为CPU即可。
首先上搜索引擎,无论是百度还是google,搜“MNIST”第一个出来的肯定是http://yann.lecun.com/exdb/mnist/ 没错,就是它!这个网页上面有四个压缩包的链接,下载下来吧少年!然后别忙着关掉这个网页,因为后面的读取数据还得依靠这个网页的说明。
下面用其中一个包t10k-images_idx3为例子,写代码说明如何使用这个数据库。
这是从verysource.com上面下载的源码,赞一个!and再赞一个!
% Matlab_Read_t10k-images_idx3.m
% 用于读取MNIST数据集中t10k-images.idx3-ubyte文件并将其转换成bmp格式图片输出。
% 用法:运行程序,会d出选择测试图片数据文件t10k-labels.idx1-ubyte路径的对话框和
% 选择保存测试图片路径的对话框,选择路径后程序自动运行完毕,期间进度条会显示处理进度。
% 图片以TestImage_00001.bmp~TestImage_10000.bmp的格式保存在指定路径,10000个文件占用空间39M。。
% 整个程序运行过程需几分钟时间。
% Written By DXY@HUST IPRAI
% 2009-2-22
clear all
clc
%读取训练图片数据文件
[FileName,PathName] = uigetfile('*.*','选择测试图片数据文件t10k-images.idx3-ubyte')
TrainFile = fullfile(PathName,FileName)
fid = fopen(TrainFile,'r')%fopen()是最核心的函数,导入文件,‘r’代表读入
a = fread(fid,16,'uint8')%这里需要说明的是,包的前十六位是说明信息,从上面提到的那个网页可以看到具体那一位代表什么意义。所以a变量提取出这些信息,并记录下来,方便后面的建立矩阵等动作。
MagicNum = ((a(1)*256+a(2))*256+a(3))*256+a(4)
ImageNum = ((a(5)*256+a(6))*256+a(7))*256+a(8)
ImageRow = ((a(9)*256+a(10))*256+a(11))*256+a(12)
ImageCol = ((a(13)*256+a(14))*256+a(15))*256+a(16)
%从上面提到的网页可以理解这四句
if ((MagicNum~=2051)||(ImageNum~=10000))
error('不是 MNIST t10k-images.idx3-ubyte 文件!')
fclose(fid)
return
end %排除选择错误的文件。
savedirectory = uigetdir('','选择测试图片路径:')
h_w = waitbar(0,'请稍候,处理中>>')
for i=1:ImageNum
b = fread(fid,ImageRow*ImageCol,'uint8') %fread()也是核心的函数之一,b记录下了一副图的数据串。注意这里还是个串,是看不出任何端倪的。
c = reshape(b,[ImageRow ImageCol])%亮点来了,reshape重新构成矩阵,终于把串转化过来了。众所周知图片就是矩阵,这里reshape出来的灰度矩阵就是该手写数字的矩阵了。
d = c'%转置一下,因为c的数字是横着的。。。
e = 255-d%根据灰度理论,0是黑色,255是白色,为了弄成白底黑字就加入了e
e = uint8(e)
savepath = fullfile(savedirectory,['TestImage_' num2str(i,'d') '.bmp'])
imwrite(e,savepath,'bmp')%最后用imwrite写出图片
waitbar(i/ImageNum)
end
fclose(fid)
close(h_w)
在选择好的路径中,就有了一大堆MNIST的手写数字的图片。想弄哪个,就用imread()弄它!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)