原文链接:http://tecdat.cn/?p=8493

在许多介绍图像识别工作的介绍中,通常应用着名的MNIST数据集。然而,这些数据存在一些问题:

1.太简略了。例如,一个简略的MLP模型能够达到99%的准确度,而一个2层CNN能够达到99%的准确度。

2.它被适度应用。从字面上看,每台机器学习入门文章或图像识别工作都将应用此数据集作为基准。然而,因为取得近乎完满的分类后果非常容易,所以它的实用性会受到打折,并且对于古代机器学习/ AI工作并不真正有用。

因而,呈现Fashion-MNIST数据集。该数据集是作为MNIST数据的间接代替而开发的,其意义在于:

1.尺寸和格调雷同:28x28灰度图像

2.每个图像与10个类中的1个相关联,即:

       0:T恤/上衣,

       1:裤子,

       2:套头衫,

       3:连衣裙,

       4 :外套,

       5:凉鞋,

       6:衬衫,

       7:运动鞋,

       8:背包,

       9:脚靴

3. 60000训练样本和10000个测试样本以下是一些样本的快照:

自从它呈现以来,曾经有多份提交文件来对这些数据进行基准测试,其中一些可能达到95%以上的准确度 。 

我也试图用keras来对这个数据进行基准测试。keras是构建深度学习模型的高级框架,在后端抉择TensorFlow,Theano和CNTK。它很容易装置和应用。对于我的应用程序,我应用了CNTK后端。 

在这里,我将以两个模型为基准。一种是层构造为256-512-100-10的MLP,另一种是类VGG的CNN。 

第一个模型在100个历元后的测试数据上达到了[0.89,0.90]的精度,而后者达到了45个期间后的测试数据的精度> 0.94。 

咱们先用tSNE来看它。据说tSNE是最无效的尺寸放大工具。 

 我应用了1000个样本来疾速运行。如果您的PC速度足够快并且有工夫,则能够针对残缺数据集运行tSNE。 

咱们看到,包含品质大小,底部决裂和对称性等几个特色将类别离开。 

为了建设本人的网络,咱们首先导入一些库

该模型在大概100个期间的测试数据集上达到了近90%的准确度。当初,咱们来构建一个相似VGG的CNN模型。咱们应用相似于VGG的体系结构,但依然十分不同。因为图形数据很小,如果咱们应用原始VGG体系结构,它很可能会适度配合,并且在测试数据时体现不佳,这些数据在下面列出的公开提交的基准测试中察看到。在keras中构建这样一个模型是十分天然和容易的:

这个模型有150万个参数。咱们能够调用'fit'办法来训练模型:

model3_fit=model3.fit(X_train, Y_train2, validation_data = (X_test, Y_test2), epochs=50, verbose=1, batch_size=500)

通过40次当前,这个模型在测试数据上取得了0.94的精度。显然,这个模型也存在适度拟合问题。咱们稍后会解决这个问题。