首頁 >後端開發 >Python教學 >Python中的影像分類實例

Python中的影像分類實例

PHPz
PHPz原創
2023-06-10 15:43:371514瀏覽

Python是一種廣泛使用的程式語言,它在電腦視覺和影像處理方面非常流行。在本文中,我們將探討Python中的影像分類實例。影像分類是電腦視覺中的一項基礎任務,它涉及識別影像中的物件或場景。本文將介紹如何使用Python中的深度學習架構Keras來實現影像分類模型的訓練和預測。

準備工作

在進行映像分類之前,我們需要先安裝必要的軟體包。以下是必要的軟體套件清單:

  • Python 3.x
  • Keras
  • TensorFlow
  • NumPy
  • #Pillow

可以使用pip工具來安裝上述軟體包。在命令列中執行以下命令,即可安裝必要的軟體包:

pip install keras
pip install tensorflow
pip install numpy
pip install Pillow

資料集

#在進行映像分類之前,我們需要一個資料集。資料集是指一組已經標註的圖像,這些圖像用於訓練和測試圖像分類模型。在本例中,我們將使用MNIST資料集。 MNIST資料集包含手寫數位影像,它是一個用於測試影像分類演算法效能的廣泛使用的資料集。

MNIST資料集包含60000張訓練圖片和10000張測試圖片,每張圖片的大小為28x28像素。這些圖片已經被標註為0到9的10個數字之一。

在Keras中,可以使用以下程式碼來下載MNIST資料集:

from keras.datasets import mnist

(train_images, train_labels), (test_images, test_labels) = mnist.load_data()

建立模型

在建立影像分類模型之前,我們需要定義模型的架構。在本例中,我們將使用一個卷積神經網路(CNN)模型。 CNN模型是一種深度學習模型,它在圖像分類方面表現良好。

Keras提供了一種簡單的方法來建立CNN模型。以下是一個範例CNN模型的程式碼:

from keras import layers
from keras import models

model = models.Sequential()

model.add(layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)))
model.add(layers.MaxPooling2D((2, 2)))

model.add(layers.Conv2D(64, (3, 3), activation='relu'))
model.add(layers.MaxPooling2D((2, 2)))

model.add(layers.Flatten())

model.add(layers.Dense(64, activation='relu'))
model.add(layers.Dense(10, activation='softmax'))

model.summary()

在上面的程式碼中,我們定義了一個包含兩個卷積層和兩個最大池化層的CNN模型。該模型還包括兩個密集層,每個層都使用ReLU激活函數。

訓練模型

在定義模型之後,我們需要訓練模型。在訓練期間,模型將學習如何將輸入影像映射到正確的數位類別。

在Keras中,可以使用以下程式碼來編譯和訓練模型:

model.compile(optimizer='rmsprop',
              loss='categorical_crossentropy',
              metrics=['accuracy'])

train_images = train_images.reshape((60000, 28, 28, 1))
train_images = train_images.astype('float32') / 255

test_images = test_images.reshape((10000, 28, 28, 1))
test_images = test_images.astype('float32') / 255

from keras.utils import to_categorical

train_labels = to_categorical(train_labels)
test_labels = to_categorical(test_labels)

model.fit(train_images, train_labels, epochs=5, batch_size=64)

在上面的程式碼中,我們首先對圖像進行預處理,然後將模型編譯為優化器為“ rmsprop”,損失函數為交叉熵的模型。然後,我們使用訓練圖像和標籤來訓練模型。在每個時期結束時,我們使用測試圖像和標籤對模型進行測試。

測試模型

在模型訓練完成後,我們可以使用測試資料集來測試模型的準確性。可以使用以下程式碼來測試模型:

test_loss, test_acc = model.evaluate(test_images, test_labels)
print('test_acc:', test_acc)

接下來,我們可以使用以下程式碼來進行預測:

predictions = model.predict(test_images)

import numpy as np

print(np.argmax(predictions[0]))

在上面的程式碼中,我們預測測試圖像集的第一張圖像,然後使用Numpy來尋找最大索引值並列印預測結果。

結論

在本文中,我們介紹如何使用Python中的深度學習架構Keras來實現影像分類模型的訓練和預測。我們使用MNIST資料集來進行測試,並使用CNN模型進行訓練。最終,我們透過對測試影像集進行預測來測試模型的準確性。這個例子可以作為一個入門的深度學習和電腦視覺的實例,讓初學者了解如何使用Python實現圖像分類任務。

以上是Python中的影像分類實例的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn