深入理解 Pytorch 核心功能：自動求導！-人工智慧-PHP中文網

首頁

科技週邊

人工智慧

深入理解 Pytorch 核心功能：自動求導！

PHPz

Jan 10, 2024 pm 07:06 PM

pytorch

嗨，我是小壯！

關於pytorch中的自動求導操作，介紹有關pytorch自動求導的概念.

自動求導是深度學習框架的重要功能，用於計算梯度，實現參數更新和最佳化.

PyTorch是一種常用的深度學習框架，採用動態計算圖和自動求導機制，簡化了梯度計算的過程。

突破 Pytorch 核心点，自动求导！！

自動求導

#自動求導是機器學習框架的重要功能，它能夠自動計算函數的導數（梯度），從而簡化了訓練深度學習模型的過程。在深度學習中，模型通常包含大量參數，手動計算梯度會變得複雜且容易出錯。 PyTorch提供了自動求導的功能，使得使用者可以輕鬆計算梯度並進行反向傳播以更新模型參數。這項功能的引入大大提高了深度學習的效率和易用性。

一點原理

PyTorch的自動求導功能是基於動態計算圖的。計算圖是一種圖結構，用於表示函數計算過程，其中節點代表操作，邊代表資料流向。與靜態計算圖不同，動態計算圖的結構可以根據實際執行過程動態生成，而非事先定義好。這種設計使得PyTorch具有彈性和可擴展性，能夠適應不同的運算需求。透過動態計算圖，PyTorch能夠記錄操作的歷史，並根據需要進行反向傳播，計算梯度。這使得PyTorch成為深度學習領域中廣泛應用的架構之一。

在PyTorch中，使用者的每個操作都被記錄下來以建立計算圖。這樣，當需要計算梯度時，PyTorch可以根據計算圖進行反向傳播並自動計算每個參數對損失函數的梯度。這基於動態計算圖的自動求導機制使得PyTorch具備了靈活性和可擴展性，使其適用於各種複雜的神經網路結構。

自動求導的基礎運算

1. 張量（Tensor）

在PyTorch中，張量是自動求導的基礎資料結構。張量類似NumPy中的多維數組，但具有額外的特性，如自動求導。透過torch.Tensor類，使用者可以建立張量並對其進行各種操作。

import torch# 创建张量x = torch.tensor([2.0], requires_grad=True)

在上述範例中，requires_grad=True表示我們希望對這個張量進行自動求導。

2. 計算圖建構

每個執行的操作都會在計算圖中建立一個節點。 PyTorch提供了各種張量操作，如加法、乘法、激活函數等，這些操作都會在計算圖中留下痕跡。

# 张量操作y = x ** 2z = 2 * y + 3

在上述例子中，y和z的計算過程都被記錄在計算圖中。

3. 梯度計算與反向傳播

一旦計算圖建構完成，可以透過呼叫.backward()方法進行反向傳播，自動計算梯度。

# 反向传播z.backward()

此時，x的梯度可以透過存取x.grad來取得。

# 获取梯度print(x.grad)

4. 停用梯度追蹤

有時候，我們希望停用對某些操作的梯度追蹤，可以使用torch.no_grad()上下文管理器。

with torch.no_grad():# 在这个区域内的操作不会被记录在计算图中w = x + 1

5. 清零梯度

在訓練循環中，通常需要在每次反向傳播之前將梯度清零，以避免梯度累積。

# 清零梯度x.grad.zero_()

一個完整案例：線性迴歸的自動求導

為了更具體地示範自動求導的過程，讓我們考慮一個簡單的線性迴歸問題。我們定義一個線性模型和一個均方誤差損失函數，並使用自動求導來最佳化模型參數。

import torch# 数据准备X = torch.tensor([[1.0], [2.0], [3.0]])y = torch.tensor([[2.0], [4.0], [6.0]])# 模型参数w = torch.tensor([[0.0]], requires_grad=True)b = torch.tensor([[0.0]], requires_grad=True)# 模型和损失函数def linear_model(X, w, b):return X @ w + bdef mean_squared_error(y_pred, y_true):return ((y_pred - y_true) ** 2).mean()# 训练循环learning_rate = 0.01epochs = 100for epoch in range(epochs):# 前向传播y_pred = linear_model(X, w, b)loss = mean_squared_error(y_pred, y)# 反向传播loss.backward()# 更新参数with torch.no_grad():w -= learning_rate * w.gradb -= learning_rate * b.grad# 清零梯度w.grad.zero_()b.grad.zero_()# 打印最终参数print("训练后的参数：")print("权重 w:", w)print("偏置 b:", b)

在這個例子中，我們定義了一個簡單的線性模型和均方誤差損失函數。透過多次迭代訓

練循環，模型的參數w和b會被最佳化，使得損失函數最小化。