PyTorch の EMNIST

Barbara Streisand
Barbara Streisandオリジナル
2024-12-10 00:33:10872ブラウズ

コーヒー買ってきて☕

*私の投稿では EMNIST について説明しています。

EMNIST() は、以下に示すように EMNIST データセットを使用できます。

*メモ:

  • 最初の引数は root(Required-Type:str または pathlib.Path) です。 *絶対パスまたは相対パスが可能です。
  • 2番目の引数はsplit(Required-Type:str)です。 ※「byclass」、「bymerge」、「balances」、「letters」、「digital」、「mnist」が設定可能です。
  • train 引数があります (Optional-Default:False-Type:float): *メモ:
    • split="byclass"とsplit="byclass"の場合、Trueの場合はトレーニングデータ(697,932枚)が使用され、Falseの場合はテストデータ(116,323枚)が使用されます。
    • split="framed" の場合、True の場合はトレーニング データ (112,800 画像) が使用され、False の場合はテスト データ (188,00 画像) が使用されます。
    • split="letters" の場合、True の場合はトレーニング データ (124,800 画像) が使用され、False の場合はテスト データ (20,800 画像) が使用されます。
    • split="digits" の場合、True の場合はトレーニングデータ (240,000 画像) が使用され、False の場合はテストデータ (40,000 画像) が使用されます。
    • split="mnist" の場合、True の場合はトレーニング データ (60,000 画像) が使用され、False の場合はテスト データ (10,000 画像) が使用されます。
  • 変換引数(Optional-Default:None-Type:callable)があります。
  • target_transform引数(Optional-Default:None-Type:callable)があります。
  • ダウンロード引数があります(Optional-Default:False-Type:bool): *メモ:
    • True の場合、データセットはインターネットからダウンロードされ、ルートに抽出 (解凍) されます。
    • これが True で、データセットが既にダウンロードされている場合、データセットは抽出されます。
    • これが True で、データセットがすでにダウンロードされ抽出されている場合は、何も起こりません。
    • データセットがすでにダウンロードされ抽出されている場合は、その方が高速であるため、False にする必要があります。
    • ここからデータセットを手動でダウンロードして抽出できます。データ/EMNIST/生/.
  • デフォルトでは画像が反転して反時計回りに90度回転してしまうバグがあるため、変換する必要があります。
from torchvision.datasets import EMNIST

train_data = EMNIST(
    root="data",
    split="byclass"
)

train_data = EMNIST(
    root="data",
    split="byclass",
    train=True,
    transform=None,
    target_transform=None,
    download=False
)

test_data = EMNIST(
    root="data",
    split="byclass",
    train=False
)

len(train_data), len(test_data)
# 697932 116323

train_data
# Dataset EMNIST
#     Number of datapoints: 697932
#     Root location: data
#     Split: Train

train_data.root
# 'data'

train_data.split
# 'byclass'

train_data.train
# True

print(train_data.transform)
# None

print(train_data.target_transform)
# None

train_data.download
# <bound method EMNIST.download of Dataset EMNIST
#     Number of datapoints: 697932
#     Root location: data
#     Split: Train>

train_data[0]
# (<PIL.Image.Image image mode=L size=28x28>, 35)

train_data[1]
# (<PIL.Image.Image image mode=L size=28x28>, 36)

train_data[2]
# (<PIL.Image.Image image mode=L size=28x28>, 6)

train_data[3]
# (<PIL.Image.Image image mode=L size=28x28>, 3)

train_data[4]
# (<PIL.Image.Image image mode=L size=28x28>, 22)

train_data.classes
# ['0', '1', '2', '3', '4', '5', '6', '7', '8', '9',
#  'A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J', 'K', 'L', 'M',
#  'N', 'O', 'P', 'Q', 'R', 'S', 'T', 'U', 'V', 'W', 'X', 'Y', 'Z',
#  'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm',
#  'n', 'o', 'p', 'q', 'r', 's', 't', 'u', 'v', 'w', 'x', 'y', 'z']
from torchvision.datasets import EMNIST

train_data = EMNIST(
    root="data",
    split="byclass",
    train=True
)

test_data = EMNIST(
    root="data",
    split="byclass",
    train=False
)

import matplotlib.pyplot as plt

def show_images(data):
    plt.figure(figsize=(12, 2))
    col = 5
    for i, (image, label) in enumerate(data, 1):
        plt.subplot(1, col, i)
        plt.title(label)
        plt.imshow(image)
        if i == col:
            break
    plt.show()

show_images(data=train_data)
show_images(data=test_data)

EMNIST in PyTorch

from torchvision.datasets import EMNIST
from torchvision.transforms import v2

train_data = EMNIST(
    root="data",
    split="byclass",
    train=True,
    transform=v2.Compose([
        v2.RandomHorizontalFlip(p=1.0),
        v2.RandomRotation(degrees=(90, 90))
    ])
)

test_data = EMNIST(
    root="data",
    split="byclass",
    train=False,
    transform=v2.Compose([
        v2.RandomHorizontalFlip(p=1.0),
        v2.RandomRotation(degrees=(90, 90))
    ])
)

import matplotlib.pyplot as plt

def show_images(data):
    plt.figure(figsize=(12, 2))
    col = 5
    for i, (image, label) in enumerate(data, 1):
        plt.subplot(1, col, i)
        plt.title(label)
        plt.imshow(image)
        if i == col:
            break
    plt.show()

show_images(data=train_data)
show_images(data=test_data)

EMNIST in PyTorch

以上がPyTorch の EMNISTの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。