60000张32*32 彩色图片 共10类
50000张训练
10000张测试
下载cifar10数据库
这是binary格式的,所以我们要把它转换成leveldb格式。
2 在../caffe-windows/examples/cifar10文件夹中有一个 convert_cifar_data.cpp
将他include到MainCaller.cpp中。如下:
编译....我是一次就通过了 ,在bin文件夹里出现convert_cifar_data.exe。然后 就可以进行格式转换。binary→leveldb
可以在bin文件夹下新建一个input文件夹。将cifar10.binary文件放在input文件夹中,这样转换时就不用写路径了。
cmd进入bin文件夹
执行后,在output文件夹下有cifar_train_leveldb和cifar_test_leveldb两个文件夹。里面是转化好的leveldb格式数据。
当然,也可以写一个bat文件处理,方便以后再次使用。
3 下面我们要求数据图像的均值
编译../../tools/comput_image_mean.cpp
编译成功后。接下来求mean
cmd进入bin。
执行后,在bin文件夹下出现一个mean.binaryproto文件,这就是所需的均值文件。
4 训练cifar网络
在.../examples/cifar10文件夹里已经有网络的配置文件,我们只需要将cifar_train_leveldb和cifar_test_leveldb两个文件夹还有mean.binaryproto文件拷到cifar0文件夹下。
修改cifar10_quick_train.prototxt中的source: "cifar-train-leveldb" mean_file: "mean.binaryproto" 和cifar10_quick_test.prototxt中的source: "cifar-test-leveldb"
mean_file: "mean.binaryproto"就可以了,
后面再训练就类似于MNIST的训练。写一个train_quick.bat,内容如下:
[plain] view plaincopy
copy ..\\..\\bin\\MainCaller.exe ..\\..\\bin\\train_net.exe
SET GLOG_logtostderr=1
"../../bin/train_net.exe" cifar10_quick_solver.prototxt
pause
1,提取单字的特征,落笔顺序,笔画、形状、轮廓、偏旁等(软件早已完成)2,建立手写模板库和单字特征数据库
3,对用户的字进行模板匹配,不能确定则给出类似字(后台进行)
4,用户选择后,利用单词库和语句库进行联想提示, 以增加用户输入速度
基于整形变换的手写汉字识别方法:在IEICE Transaction、电子学报等国内外学术杂志上发表10多篇相关论文。在对日本国家标准汉字数据库ETL9的测试中获最高识别率,在1995年和 1998年国家863举行的两次全国评测中分别获得识别率的第一名和第三名。
HCL2000:在国家863计划支持下研制完成的一个大规模脱机手写汉字数据库。HCL2000面向国标一级汉字,每个汉字有近2000个样本,并包含书写者信息。是目前世界上样本数最多信息最丰富的脱机手写汉字数据库,不仅可用于汉字识别系统的训练和测试,还可用于研究影响文字书写的各种因素。目前已在清华大学、北京大学、北京邮电大学、华南理工大学、国家信息工程中心、汉王公司等单位的研究开发工作中被实际采用。
书童码汉字输入法:获国家发明专利。 《人民日报》、《光明日报》、《科技日报》、《中国青年报》、《计算机世界》、《中华工商时报》、《金融时报》等多家报纸宣传报道,已在全国范围内推广应用。
《网络管理与控制技术》:人民邮电出版社,1999年1月,原邮电部重点教材
《智能信息技术》:北京邮电大学出版社,1999年10月
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)