찾다
백엔드 개발파이썬 튜토리얼신경망 훈련에 PyTorch를 사용하는 방법

신경망 훈련에 PyTorch를 사용하는 방법

소개:
PyTorch는 Python 기반의 오픈 소스 기계 학습 프레임워크로 유연성과 단순성으로 인해 많은 연구원과 엔지니어가 가장 먼저 선택합니다. 이 기사에서는 신경망 훈련에 PyTorch를 사용하는 방법을 소개하고 해당 코드 예제를 제공합니다.

1. PyTorch 설치
시작하기 전에 먼저 PyTorch를 설치해야 합니다. 공식 홈페이지(https://pytorch.org/)에서 제공하는 설치 가이드를 통해 운영체제 및 하드웨어에 적합한 버전을 선택하여 설치할 수 있습니다. 설치가 완료되면 Python으로 PyTorch 라이브러리를 가져오고 코드 작성을 시작할 수 있습니다.

2. 신경망 모델 구축
PyTorch를 사용하여 신경망을 훈련시키기 전에 먼저 적합한 모델을 구축해야 합니다. PyTorch는 자신만의 신경망 모델을 정의하기 위해 상속할 수 있는 torch.nn.Module이라는 클래스를 제공합니다. torch.nn.Module的类,您可以通过继承该类来定义自己的神经网络模型。

下面是一个简单的例子,展示了如何使用PyTorch构建一个包含两个全连接层的神经网络模型:

import torch
import torch.nn as nn

class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.fc1 = nn.Linear(in_features=784, out_features=256)
        self.fc2 = nn.Linear(in_features=256, out_features=10)
    
    def forward(self, x):
        x = x.view(x.size(0), -1)
        x = self.fc1(x)
        x = torch.relu(x)
        x = self.fc2(x)
        return x

net = Net()

在上面的代码中,我们首先定义了一个名为Net的类,并继承了torch.nn.Module类。在__init__方法中,我们定义了两个全连接层fc1fc2。然后,我们通过forward方法定义了数据在模型中前向传播的过程。最后,我们创建了一个Net的实例。

三、定义损失函数和优化器
在进行训练之前,我们需要定义损失函数和优化器。PyTorch提供了丰富的损失函数和优化器的选择,可以根据具体情况进行选择。

下面是一个示例,展示了如何定义一个使用交叉熵损失函数和随机梯度下降优化器的训练过程:

loss_fn = nn.CrossEntropyLoss()
optimizer = torch.optim.SGD(net.parameters(), lr=0.01)

在上面的代码中,我们将交叉熵损失函数和随机梯度下降优化器分别赋值给了loss_fnoptimizer变量。net.parameters()表示我们要优化神经网络模型中的所有可学习参数,lr参数表示学习率。

四、准备数据集
在进行神经网络训练之前,我们需要准备好训练数据集和测试数据集。PyTorch提供了一些实用的工具类,可以帮助我们加载和预处理数据集。

下面是一个示例,展示了如何加载MNIST手写数字数据集并进行预处理:

import torchvision
import torchvision.transforms as transforms

transform = transforms.Compose([
    transforms.ToTensor(),
    transforms.Normalize((0.5,), (0.5,)),
])

train_set = torchvision.datasets.MNIST(root='./data', train=True, download=True, transform=transform)
train_loader = torch.utils.data.DataLoader(train_set, batch_size=32, shuffle=True)

test_set = torchvision.datasets.MNIST(root='./data', train=False, download=True, transform=transform)
test_loader = torch.utils.data.DataLoader(test_set, batch_size=32, shuffle=False)

在上面的代码中,我们首先定义了一个transform变量,用于对数据进行预处理。然后,我们使用torchvision.datasets.MNIST类加载MNIST数据集,并使用train=Truetrain=False参数指定了训练数据集和测试数据集。最后,我们使用torch.utils.data.DataLoader类将数据集转换成一个可以迭代的数据加载器。

五、开始训练
准备好数据集后,我们就可以开始进行神经网络的训练。在一个训练循环中,我们需要依次完成以下步骤:将输入数据输入到模型中,计算损失函数,反向传播更新梯度,优化模型。

下面是一个示例,展示了如何使用PyTorch进行神经网络训练:

for epoch in range(epochs):
    running_loss = 0.0
    for i, data in enumerate(train_loader):
        inputs, labels = data
        
        optimizer.zero_grad()
        
        outputs = net(inputs)
        loss = loss_fn(outputs, labels)
        
        loss.backward()
        optimizer.step()
        
        running_loss += loss.item()
        
        if (i+1) % 100 == 0:
            print('[%d, %5d] loss: %.3f' % (epoch+1, i+1, running_loss/100))
            running_loss = 0.0

在上面的代码中,我们首先使用enumerate函数遍历了训练数据加载器,得到了输入数据和标签。然后,我们将梯度清零,将输入数据输入到模型中,计算预测结果和损失函数。接着,我们通过backward方法计算梯度,再通过step方法更新模型参数。最后,我们累加损失,并根据需要进行打印。

六、测试模型
训练完成后,我们还需要测试模型的性能。我们可以通过计算模型在测试数据集上的准确率来评估模型的性能。

下面是一个示例,展示了如何使用PyTorch测试模型的准确率:

correct = 0
total = 0

with torch.no_grad():
    for data in test_loader:
        inputs, labels = data
        outputs = net(inputs)
        _, predicted = torch.max(outputs.data, 1)
        total += labels.size(0)
        correct += (predicted == labels).sum().item()

accuracy = 100 * correct / total
print('Accuracy: %.2f %%' % accuracy)

在上面的代码中,我们首先定义了两个变量correcttotal,用于计算正确分类的样本和总样本数。接着,我们使用torch.no_grad()

다음은 PyTorch를 사용하여 두 개의 완전히 연결된 레이어가 포함된 신경망 모델을 구축하는 방법을 보여주는 간단한 예입니다.

rrreee
위 코드에서는 먼저 Net이라는 클래스를 정의하고 torch.nn에서 상속합니다. 모듈 클래스. __init__ 메서드에서는 두 개의 완전히 연결된 레이어 fc1fc2를 정의합니다. 그런 다음 forward 메서드를 통해 모델에서 데이터의 순방향 전파 프로세스를 정의합니다. 마지막으로 Net 인스턴스를 만듭니다.

3. 손실 함수와 옵티마이저 정의

훈련 전에 손실 함수와 옵티마이저를 정의해야 합니다. PyTorch는 특정 상황에 따라 선택할 수 있는 다양한 손실 함수 및 최적화 프로그램을 제공합니다.
  1. 다음은 교차 엔트로피 손실 함수와 확률적 경사하강법 최적화 도구를 사용하여 훈련 과정을 정의하는 방법을 보여주는 예입니다.
  2. rrreee
  3. 위 코드에서는 교차 엔트로피 손실 함수와 확률적 경사하강법 최적화 도구를 할당합니다. 별도로 loss_fnoptimizer 변수가 제공됩니다. net.parameters()는 신경망 모델에서 학습 가능한 모든 매개변수를 최적화하려고 함을 나타내고 lr 매개변수는 학습 속도를 나타냅니다.
4. 데이터 세트 준비🎜 신경망을 훈련시키기 전에 훈련 데이터 세트와 테스트 데이터 세트를 준비해야 합니다. PyTorch는 데이터 세트를 로드하고 전처리하는 데 도움이 되는 몇 가지 실용적인 도구 클래스를 제공합니다. 🎜🎜다음은 MNIST 필기 숫자 데이터 세트를 로드하고 전처리하는 방법을 보여주는 예입니다. 🎜rrreee🎜위 코드에서는 먼저 transform 변수를 정의하여 데이터 전처리를 변환합니다. 그런 다음 torchvision.datasets.MNIST 클래스를 사용하여 MNIST 데이터세트를 로드하고 train=Truetrain=False 매개변수를 사용하여 훈련 데이터를 지정했습니다. 데이터 세트를 설정하고 테스트합니다. 마지막으로 torch.utils.data.DataLoader 클래스를 사용하여 데이터 세트를 반복 가능한 데이터 로더로 변환합니다. 🎜🎜5. 훈련 시작🎜 데이터 세트를 준비한 후 신경망 훈련을 시작할 수 있습니다. 훈련 루프에서는 입력 데이터를 모델에 입력하고, 손실 함수를 계산하고, 업데이트된 기울기를 역전파하고, 모델을 최적화하는 단계를 순서대로 완료해야 합니다. 🎜🎜다음은 신경망 훈련에 PyTorch를 사용하는 방법을 보여주는 예입니다. 🎜rrreee🎜위 코드에서는 먼저 enumerate 함수를 사용하여 훈련 데이터 로더를 탐색하여 입력 데이터와 레이블을 가져옵니다. 그런 다음 기울기를 0으로 만들고 입력 데이터를 모델에 공급한 다음 예측 및 손실 함수를 계산합니다. 다음으로 backward 메서드를 통해 기울기를 계산한 다음 step 메서드를 통해 모델 매개변수를 업데이트합니다. 마지막으로 손실을 누적하고 필요에 따라 인쇄합니다. 🎜🎜 6. 모델 테스트 🎜훈련이 완료된 후에도 모델의 성능을 테스트해야 합니다. 테스트 데이터 세트에 대한 정확도를 계산하여 모델의 성능을 평가할 수 있습니다. 🎜🎜다음은 PyTorch를 사용하여 모델의 정확성을 테스트하는 방법을 보여주는 예입니다. 🎜rrreee🎜위 코드에서는 먼저 corrighttotal 두 변수를 정의하고 사용합니다. 올바르게 분류된 샘플 수와 전체 샘플 수를 계산합니다. 다음으로 torch.no_grad() 컨텍스트 관리자를 사용하여 기울기 계산을 꺼서 메모리 소비를 줄입니다. 그런 다음 예측 결과를 순차적으로 계산하고 올바르게 분류된 샘플 수와 총 샘플 수를 업데이트합니다. 마지막으로 정확하게 분류된 샘플 수와 전체 샘플 수를 기준으로 정확도를 계산하여 인쇄합니다. 🎜🎜요약: 🎜이 글의 서론을 통해 신경망 훈련에 PyTorch를 사용하는 방법의 기본 단계를 이해했으며, 신경망 모델 구축, 손실 함수 및 옵티마이저 정의, 데이터 세트 준비, 훈련 시작 방법을 배웠습니다. 그리고 모델을 테스트합니다. 이 기사가 신경망 훈련에 PyTorch를 사용하는 작업과 연구에 도움이 되기를 바랍니다. 🎜🎜참고자료: 🎜🎜🎜PyTorch 공식 웹사이트: https://pytorch.org/🎜🎜PyTorch 문서: https://pytorch.org/docs/stable/index.html🎜🎜

위 내용은 신경망 훈련에 PyTorch를 사용하는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
파이썬 어레이에 어떤 데이터 유형을 저장할 수 있습니까?파이썬 어레이에 어떤 데이터 유형을 저장할 수 있습니까?Apr 27, 2025 am 12:11 AM

PythonlistsCanstoreAnyDatAtype, ArrayModuLearRaysStoreOneType 및 NUMPYARRAYSAREFORNUMERICALPUTATION.1) LISTSAREVERSATILEBUTLESSMEMORY-EFFICENT.2) ARRAYMODUERRAYRAYRAYSARRYSARESARESARESARESARESARESAREDOREDORY-UNFICEDONOUNEOUSDATA.3) NumpyArraysUraysOrcepperperperperperperperperperperperperperperperferperferperferferpercient

파이썬 어레이에 잘못된 데이터 유형의 값을 저장하려고하면 어떻게됩니까?파이썬 어레이에 잘못된 데이터 유형의 값을 저장하려고하면 어떻게됩니까?Apr 27, 2025 am 12:10 AM

whenyouattempttoreavalueofthewrongdatatypeinapythonaphonarray, thisiSdueTotheArrayModule의 stricttyPeenforcement, theAllElementStobeofthesAmetypecified bythetypecode.forperformancersassion, arraysaremoreficats the thraysaremoreficats thetheperfication the thraysaremorefications는

Python Standard Library의 일부는 무엇입니까? 목록 또는 배열은 무엇입니까?Python Standard Library의 일부는 무엇입니까? 목록 또는 배열은 무엇입니까?Apr 27, 2025 am 12:03 AM

Pythonlistsarepartoftsandardlardlibrary, whileraysarenot.listsarebuilt-in, 다재다능하고, 수집 할 수있는 반면, arraysarreprovidedByTearRaymoduledlesscommonlyusedDuetolimitedFunctionality.

스크립트가 잘못된 파이썬 버전으로 실행되는지 확인해야합니까?스크립트가 잘못된 파이썬 버전으로 실행되는지 확인해야합니까?Apr 27, 2025 am 12:01 AM

thescriptIsrunningwithHongpyThonversionDueCorRectDefaultTerpretersEttings.tofixThis : 1) checktheDefaultPyThonVersionUsingPyThon-VersionorPyThon3- version.2) usvirtual-ErondmentsBythePython.9-Mvenvmyenv, 활성화, 및 파괴

파이썬 어레이에서 수행 할 수있는 일반적인 작업은 무엇입니까?파이썬 어레이에서 수행 할 수있는 일반적인 작업은 무엇입니까?Apr 26, 2025 am 12:22 AM

PythonArraysSupportVariousOperations : 1) SlicingExtractsSubsets, 2) 추가/확장 어드먼트, 3) 삽입 값 삽입 ATSpecificPositions, 4) retingdeletesElements, 5) 분류/ReversingChangesOrder 및 6) ListsompectionScreateNewListSbasedOnsistin

어떤 유형의 응용 프로그램에서 Numpy Array가 일반적으로 사용됩니까?어떤 유형의 응용 프로그램에서 Numpy Array가 일반적으로 사용됩니까?Apr 26, 2025 am 12:13 AM

NumpyArraysareSentialplosplicationSefficationSefficientNumericalcomputationsanddatamanipulation. Theyarcrucialindatascience, MachineLearning, Physics, Engineering 및 Financeduetotheiribility에 대한 handlarge-scaledataefficivally. forexample, Infinancialanyaly

파이썬의 목록 위의 배열을 언제 사용 하시겠습니까?파이썬의 목록 위의 배열을 언제 사용 하시겠습니까?Apr 26, 2025 am 12:12 AM

UseanArray.ArrayOveralistInpyThonWhendealingwithhomogeneousData, Performance-CriticalCode, OrinterFacingwithCcode.1) HomogeneousData : ArraysSaveMemorywithtypepletement.2) Performance-CriticalCode : arraysofferbetterporcomanceFornumericalOperations.3) Interf

모든 목록 작업은 배열에 의해 지원됩니까? 왜 또는 왜 그렇지 않습니까?모든 목록 작업은 배열에 의해 지원됩니까? 왜 또는 왜 그렇지 않습니까?Apr 26, 2025 am 12:05 AM

아니요, NOTALLLISTOPERATIONARESUPPORTEDBYARRARES, andVICEVERSA.1) ArraySDONOTSUPPORTDYNAMICOPERATIONSLIKEPENDORINSERTWITHUTRESIGING, WHITHIMPACTSPERFORMANCE.2) ListSDONOTEECONSTANTTIMECOMPLEXITEFORDITITICCESSLIKEARRAYSDO.

See all articles

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

Video Face Swap

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

VSCode Windows 64비트 다운로드

VSCode Windows 64비트 다운로드

Microsoft에서 출시한 강력한 무료 IDE 편집기

SublimeText3 Linux 새 버전

SublimeText3 Linux 새 버전

SublimeText3 Linux 최신 버전

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

mPDF

mPDF

mPDF는 UTF-8로 인코딩된 HTML에서 PDF 파일을 생성할 수 있는 PHP 라이브러리입니다. 원저자인 Ian Back은 자신의 웹 사이트에서 "즉시" PDF 파일을 출력하고 다양한 언어를 처리하기 위해 mPDF를 작성했습니다. HTML2FPDF와 같은 원본 스크립트보다 유니코드 글꼴을 사용할 때 속도가 느리고 더 큰 파일을 생성하지만 CSS 스타일 등을 지원하고 많은 개선 사항이 있습니다. RTL(아랍어, 히브리어), CJK(중국어, 일본어, 한국어)를 포함한 거의 모든 언어를 지원합니다. 중첩된 블록 수준 요소(예: P, DIV)를 지원합니다.