一共包括10格类别的RGB彩色图片:
飞机、汽车、鸟、猫、鹿、狗、蛙、马、船、卡车
图片尺寸为:32*32
数据集中:50 000张训练图、10 000张测试图
与MNIST相比,CIFAR-10具有以下不同点:
1.CIFAR-10是3通道的彩色RGB图像,而MNIST是灰度图
2.CIFAR-10的尺寸为:32*32,MNIST的尺寸为:28*28
3.CIFAR-10含有的是现实世界中真实的物体,噪声大,比例,特征都不相同
直接的线性模型如:Softmax在CIFAR-10上表现很差
数据集内容如下:
cifar-10-binary.tar.gz为原始压缩文件包,cifar-10-batches-bin为解压后的资源文件夹。
打开cifar-10-batches-bin文件夹:
介绍:
batches.meta.txt:为文本文件,储存了每个类别的英文名
data_batch_1.bin、
data_batch_2.bin、
data_batch_3.bin、
data_batch_4.bin、
data_batch_5.bin
是5个训练数据集,每个文件存储了10000张32*32彩色图片和对应的类别标签,共50 000张
test _batch.bin 存储了用于测试的10000张32*32彩色图片和对应的类别标签
readme.html是数据集介绍文件
1 cifar10数据库60000张32*32 彩色图片 共10类50000张训练10000张测试下载cifar10数据库 这是binary格式的,所以我们要把它转换成leveldb格式。2 在../caffe-windows/examples/cifar10文件夹中有一个 convert_cifar_data.cpp将他include到MainCaller.cpp中。如下:编译....我是一次就通过了 ,在bin文件夹里出现convert_cifar_data.exe。然后 就可以进行格式转换。binary→leveldb可以在bin文件夹下新建一个input文件夹。将cifar10.binary文件放在input文件夹中,这样转换时就不用写路径了。cmd进入bin文件夹执行后,在output文件夹下有cifar_train_leveldb和cifar_test_leveldb两个文件夹。里面是转化好的leveldb格式数据。当然,也可以写一个bat文件处理,方便以后再次使用。方法/步骤:
在百度上搜索CIFAR10,下载适用于python的数据集。
把下载的压缩包解压到某个文件夹里面。
数据集包括6个文件,其中前五个是训练集,最后一个是测试集。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)