目前常用的手写字体（数字，字母，汉字）数据集有哪些？_sql

1 cifar10数据库

60000张32*32 彩色图片共10类

50000张训练

10000张测试

下载cifar10数据库

这是binary格式的，所以我们要把它转换成leveldb格式。

2 在../caffe-windows/examples/cifar10文件夹中有一个 convert_cifar_data.cpp

将他include到MainCaller.cpp中。如下：

编译....我是一次就通过了，在bin文件夹里出现convert_cifar_data.exe。然后就可以进行格式转换。binary→leveldb

可以在bin文件夹下新建一个input文件夹。将cifar10.binary文件放在input文件夹中，这样转换时就不用写路径了。

cmd进入bin文件夹

执行后，在output文件夹下有cifar_train_leveldb和cifar_test_leveldb两个文件夹。里面是转化好的leveldb格式数据。

当然，也可以写一�¸.batæä»¶å¤çï¼æ¹ä¾¿ä»¥ååæ¬¡ä½¿ç¨ã

3 ä¸é¢æä»¬è¦æ±æ°æ®å¾åçåå¼

ç¼è¯../../tools/comput_image_mean.cpp

ç¼è¯æååãæ¥ä¸æ¥æ±mean

cmdè¿å¥binã

4 è®ç»cifarç½ç»

å¨.../examples/cifar10æä»¶å¤¹éå·²ç»æç½ç»çéç½®æä»¶ï¼æä»¬åªéè¦å°cifar_train_leveldbåcifar_test_leveldbä¸¤ä¸ªæä»¶å¤¹è¿æmean.binaryprotoæä»¶æ·å°cifar0æä»¶å¤¹ä¸ã

ä¿®æ¹cifar10_quick_train.prototxtä¸çsource: "cifar-train-leveldb" mean_file: "mean.binaryproto" åcifar10_quick_test.prototxtä¸çsource: "cifar-test-leveldb"

mean_file: "mean.binaryproto"å°±å¯ä»¥äºï¼

[plain] view plaincopy

copy ..\\..\\bin\\MainCaller.exe ..\\..\\bin\\train_net.exe

SET GLOG_logtostderr=1

"../../bin/train_net.exe" cifar10_quick_solver.prototxt

pause

基于整形变换的手写汉字识别方法:在IEICE Transaction、电子学报等国内外学术杂志上发表10多篇相关论文。在对日本国家标准汉字数据库ETL9的测试中获最高识别率，在1995年和 1998年国家863举行的两次全国评测中分别获得识别率的第一名和第三名。

HCL2000：在国家863计划支持下研制完成的一个大规模脱机手写汉字数据库。HCL2000面向国标一级汉字，每个汉字有近2000个样本，并包含书写者信息。是目前世界上样本数最多信息最丰富的脱机手写汉字数据库，不仅可用于汉字识别系统的训练和测试，还可用于研究影响文字书写的各种因素。目前已在清华大学、北京大学、北京邮电大学、华南理工大学、国家信息工程中心、汉王公司等单位的研究开发工作中被实际采用。

书童码汉字输入法：获国家发明专利。《人民日报》、《光明日报》、《科技日报》、《中国青年报》、《计算机世界》、《中华工商时报》、《金融时报》等多家报纸宣传报道，已在全国范围内推广应用。

《网络管理与控制技术》：人民邮电出版社，1999年1月，原邮电部重点教材

《智能信息技术》：北京邮电大学出版社，1999年10月

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/sjk/9910545.html

目前常用的手写字体（数字，字母，汉字）数据集有哪些？

发表评论

评论列表（0条）