卷积神经网络(Convolutional Neural Networks, CNN)是一类特地实用于解决图像数据的深度学习模型。在Python中,咱们能够应用风行的深度学习库TensorFlow和Keras来创立和训练一个CNN模型。在本文中,咱们将介绍如何应用Keras创立一个简略的CNN模型,并用它对手写数字进行分类。
1. 筹备数据集
咱们将应用MNIST数据集,这是一个罕用的手写数字数据集。Keras库提供了一个不便的函数来加载MNIST数据集。数据集蕴含60000个训练样本和10000个测试样本,每个样本是一个28x28的灰度图像。
from tensorflow.keras.datasets import mnist(train_images, train_labels), (test_images, test_labels) = mnist.load_data()
接下来,咱们须要对数据进行预处理。咱们将图像数据归一化到0-1之间,并将标签数据进行one-hot编码:
train_images = train_images.reshape((60000, 28, 28, 1))train_images = train_images.astype("float32") / 255test_images = test_images.reshape((10000, 28, 28, 1))test_images = test_images.astype("float32") / 255from tensorflow.keras.utils import to_categoricaltrain_labels = to_categorical(train_labels)test_labels = to_categorical(test_labels)
2. 创立CNN模型
咱们将应用Keras创立一个简略的CNN模型,包含卷积层、池化层、全连贯层等。模型的构造如下:
- 卷积层:应用32个3x3的卷积核,激活函数为ReLU;
- 池化层:应用2x2的最大池化;
- 卷积层:应用64个3x3的卷积核,激活函数为ReLU;
- 池化层:应用2x2的最大池化;
- 全连贯层:蕴含128个神经元,激活函数为ReLU;
- 输入层:蕴含10个神经元,激活函数为softmax。
from tensorflow.keras import layersfrom tensorflow.keras import modelsmodel = models.Sequential()model.add(layers.Conv2D(32, (3, 3), activation="relu", input_shape=(28, 28, 1)))model.add(layers.MaxPooling2D((2, 2)))model.add(layers.Conv2D(64, (3, 3), activation="relu"))model.add(layers.MaxPooling2D((2, 2)))model.add(layers.Flatten())model.add(layers.Dense(128, activation="relu"))model.add(layers.Dense(10, activation="softmax"))
3. 训练CNN模型
咱们将应用训练数据集训练CNN模型,并在测试数据集上评估模型性能。咱们将应用穿插熵损失函数和Adam优化器,训练10个epoch。
model.compile(optimizer="adam", loss="categorical_crossentropy", metrics=["accuracy"])model.fit(train_images, train_labels, epochs=10, batch_size=64)test_loss, test_acc = model.evaluate(test_images, test_labels)print("Test accuracy: {:.2f}%".format(test_acc * 100))
4. 应用CNN模型进行预测
训练好CNN模型后,咱们能够用它对新的图像数据进行预测。上面咱们将随机抉择一个测试图像,并应用模型进行预测。
import numpy as npimport matplotlib.pyplot as pltindex = np.random.randint(0, len(test_images))image = test_images[index]plt.imshow(image.reshape(28, 28), cmap="gray")plt.show()predictions = model.predict(np.expand_dims(image, axis=0))predicted_label = np.argmax(predictions)print("Predicted label:", predicted_label)
上述代码将展现一个随机抉择的手写数字图像,并输入模型预测的后果。
这就是如何在Python中应用Keras创立和训练一个简略的CNN模型进行手写数字分类。在理论利用中,能够依据需要调整CNN模型的构造和参数以优化性能。