Tensorflow之CIFAR-10介绍

Tensorflow之CIFAR-10介绍,第1张

CIFAR-10是由Alex和Ilya整理的一个用于识别普适物体的小型数据集。

一共包括10格类别的RGB彩色图片:

飞机、汽车、鸟、猫、鹿、狗、蛙、马、船、卡车

图片尺寸为:32*32

数据集中:50 000张训练图、10 000张测试图

与MNIST相比,CIFAR-10具有以下不同点:

1.CIFAR-10是3通道的彩色RGB图像,而MNIST是灰度图

2.CIFAR-10的尺寸为:32*32,MNIST的尺寸为:28*28

3.CIFAR-10含有的是现实世界中真实的物体,噪声大,比例,特征都不相同

直接的线性模型如:Softmax在CIFAR-10上表现很差

数据集内容如下:

cifar-10-binary.tar.gz为原始压缩文件包,cifar-10-batches-bin为解压后的资源文件夹

打开cifar-10-batches-bin文件夹:

介绍:

batches.meta.txt:为文本文件,储存了每个类别的英文名

data_batch_1.bin、

data_batch_2.bin、

data_batch_3.bin、

data_batch_4.bin、

data_batch_5.bin 

是5个训练数据集,每个文件存储了10000张32*32彩色图片和对应的类别标签,共50 000张

test _batch.bin 存储了用于测试的10000张32*32彩色图片和对应的类别标签

readme.html是数据集介绍文件

 1 cifar10数据库60000张32*32 彩色图片 共10类50000张训练10000张测试下载cifar10数据库 这是binary格式的,所以我们要把它转换成leveldb格式。2 在../caffe-windows/examples/cifar10文件夹中有一个 convert_cifar_data.cpp将他include到MainCaller.cpp中。如下:编译....我是一次就通过了 ,在bin文件夹里出现convert_cifar_data.exe。然后 就可以进行格式转换。binary→leveldb可以在bin文件夹下新建一个input文件夹。将cifar10.binary文件放在input文件夹中,这样转换时就不用写路径了。cmd进入bin文件夹执行后,在output文件夹下有cifar_train_leveldb和cifar_test_leveldb两个文件夹。里面是转化好的leveldb格式数据。当然,也可以写一个bat文件处理,方便以后再次使用。

方法/步骤:

在百度上搜索CIFAR10,下载适用于python的数据集。

把下载的压缩包解压到某个文件夹里面。

数据集包括6个文件,其中前五个是训练集,最后一个是测试集。


欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/sjk/9952903.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-03
下一篇 2023-05-03

发表评论

登录后才能评论

评论列表(0条)

保存