>本文详细介绍了使用卷积神经网络(CNN)和MNIST数据集构建用于手写数字识别的KERAS模型。 让我们重新提示它以清晰并改善流程。
>用keras 构建手写数字识别器
>本教程演示了创建一个模型,使用Python的Keras库识别手写数字,这是一种简化建筑和培训神经网络的高级API。我们将利用卷积神经网络(CNN)和广泛使用的MNIST数据集的力量。
理解方法
我们的模型采用CNN,这是一种特别有效的图像分类体系结构。与传统的神经网络不同,CNNS在3D阵列(X,Y坐标和颜色)中处理数据,使其非常适合图像数据。 MNIST数据集包含60,000个培训和10,000个手写数字的测试示例,为培训提供了必要的标签数据。
>人工神经网络(ANN)和CNNS > ANN是一个数学模型,通过隐藏的图层将输入数据转换为输出,每个层代表概率。 培训涉及根据错误调整权重和偏见,从而使网络学习模式。 CNNS为图像处理提供了重要的优势。它们的3D阵列结构意味着每个隐藏层节点仅连接到一个小输入区域,与传统ANN相比,效率大大提高。 关键CNN层包括卷积层(特征提取),合并层(功能降低),变平层(降低维度)和最终分类层。
>
加载培训和测试数据。 可视化样品数字有助于理解数据结构:
mnist.load_data()
<code class="language-python">from keras.datasets import mnist import matplotlib.pyplot as plt (x_train, y_train), (x_test, y_test) = mnist.load_data() image_index = 35 plt.imshow(x_train[image_index], cmap='Greys') plt.show()</code>
数据预处理
在创建模型之前,数据需要预处理:
.reshape()
>。y_train
>使用y_test
将因变量(to_categorical()
,<code class="language-python">from keras.datasets import mnist import matplotlib.pyplot as plt (x_train, y_train), (x_test, y_test) = mnist.load_data() image_index = 35 plt.imshow(x_train[image_index], cmap='Greys') plt.show()</code>
型号设计和训练
>我们的CNN模型是依次构建的:
<code class="language-python">img_rows, img_cols = 28, 28 x_train = x_train.reshape(x_train.shape[0], img_rows, img_cols, 1) / 255 x_test = x_test.reshape(x_test.shape[0], img_rows, img_cols, 1) / 255 y_train = to_categorical(y_train, num_classes=10) y_test = to_categorical(y_test, num_classes=10)</code>进行训练,指定时期和批量尺寸。训练有素的模型可保存以供以后使用。
>
sparse_categorical_crossentropy
使用自定义图像进行测试.fit()
<code class="language-python">from keras.models import Sequential from keras.layers import Dense, Dropout, Flatten, Conv2D, MaxPooling2D model = Sequential([ Conv2D(32, (3, 3), activation='relu', input_shape=(img_rows, img_cols, 1)), Conv2D(64, (3, 3), activation='relu'), MaxPooling2D((2, 2)), Dropout(0.25), Flatten(), Dense(128, activation='relu'), Dropout(0.5), Dense(10, activation='softmax') # 10 output classes (digits 0-9) ])</code>
为了测试模型,我们加载自定义手写数字图像,预处理(转换为灰度,重塑,归一化),加载保存的模型并使用>进行分类。
>
.predict()
<code class="language-python">model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy']) model.fit(x_train, y_train, batch_size=128, epochs=10, validation_data=(x_test, y_test)) model.save("test_model.h5")</code>
结论
本教程提供了对使用Keras和CNN构建手写数字识别模型的基本理解。 尽管实现高精度(例如,&GT; 99%),但通过模型参数调整,数据增强和探索更高级的CNN体系结构进行了进一步的改进。 提供的常见问题解答提供了对所涉及概念的进一步见解。
以上是KERAS的初学者指南:30分钟内数字识别的详细内容。更多信息请关注PHP中文网其他相关文章!