Python PyTorch 中的“view”方法是如何工作的？

Python 的 PyTorch 庫中的“view”方法是一個強大的工具，允許靈活地操作張量的形狀。理解“view”方法的工作原理對於有效地重塑張量以滿足深度學習模型中的特定要求至關重要。透過利用“view”方法，開發者可以修改張量的維度而不改變其底層資料，從而實現與各種網路架構的無縫相容性。在本文中，我們將深入探討“view”方法的內部工作原理，探索其語法、應用和實際示例，以增強您對這一 PyTorch 基本功能的理解。

理解 PyTorch 中的張量

在我們討論“view”方法之前，讓我們簡要回顧一下 PyTorch 中的張量。PyTorch 用於儲存和處理多維資料的主要資料結構是張量。它們類似於其他程式語言中的矩陣或陣列，但包含專門為深度學習操作設計的額外功能。

張量可以具有不同的維度或秩，例如一維向量、零維標量、二維矩陣和更高維度的陣列。它們能夠儲存浮點數和整數，以及其他型別的數值資料。

Pytorch 中的“View”方法是如何工作的？

Python 的 PyTorch 庫中的“view”方法是一個關鍵功能，它使使用者能夠操作張量的形狀，同時保留原始資料。張量是多維陣列，是許多深度學習模型的基礎，因此理解如何重塑它們以滿足各種網路架構的要求至關重要。

“view”方法透過改變張量的形狀來工作，同時保留其原始資料。簡單來說，它使開發人員能夠調整張量的大小和結構，而無需修改它包含的資訊。此功能對於操作張量以符合神經網路架構的特定需求特別有價值。

語法

“view”方法的語法相對簡單。我們可以使用以下語法將“view”方法應用於張量：

new_tensor = tensor.view(shape)

這裡，“tensor”指的是我們要重塑的原始張量，“shape”表示我們要應用於張量的新的形狀。生成的張量“new_tensor”將具有指定的形狀。

PyTorch 中的“view”方法提供了多種用例和應用程式，用於操作張量形狀。以下是“view”方法證明有用的某些常見場景：

重塑張量

“view”方法的主要用例是重塑張量。它允許您修改張量的維度，同時保留底層資料。例如，假設我們有一個形狀為 (4, 2) 的張量 x，我們想將其重塑為 (2, 4)。我們可以使用“view”方法實現這一點：

示例

import torch
x = torch.tensor([[1, 2], [3, 4], [5, 6], [7, 8]])
reshaped_x = x.view(2, 4)
print(reshaped_x)

輸出

C:\Users\Tutorialspoint>python main.py
tensor([[1, 2, 3, 4],
      [5, 6, 7, 8]])

生成的張量 reshaped_x 將具有 (2, 4) 的形狀，其資料與原始張量 x 相同。

展平張量

展平張量是另一個常見的應用，其中張量被轉換為一維陣列。這對於期望以展平結構輸入的深度學習模型通常是必要的。例如，如果我們擁有一個形狀為 (2, 3, 4) 的張量 y，我們可以使用“view”方法將其展平：

示例

import torch
y = torch.randn(2, 3, 4)
flattened_y = y.view(-1)
print(flattened_y)

輸出

C:\Users\Tutorialspoint>python main.py
tensor([ 0.8790,  1.6022,  0.4352,  1.6935,  1.1671, -0.2613, -0.9020,  0.1835,
      0.0258,  0.2018,  0.2362,  0.7486,  1.8985, -1.3345,  0.2113,  0.8931,
      0.5686, -0.4857,  0.6443,  1.4353,  1.7608,  0.5040, -0.4212,  1.1389])

生成的張量 flattened_y 將具有 (24,) 的形狀，因為它將 y 的所有元素組合到一個維度中。

調整批次大小

在深度學習場景中處理批次資料時，“view”方法非常有用。例如，讓我們考慮一個由形狀為 (32, 3, 64, 64) 的張量“images”表示的影像資料批次，其中 32 表示批次大小，3 表示 RGB 通道，64x64 表示影像大小。如果我們希望將批次大小修改為 16，我們可以按以下方式使用“view”方法：

示例

import torch
x = torch.arange(1, 13)
reshaped_x = x.view(6, 2)  # Reshape to (6, 2)
print("\nReshaped tensor:")
print(reshaped_x)

輸出

C:\Users\Tutorialspoint>python main.py

Reshaped tensor:
tensor([[ 1,  2],
      [ 3,  4],
      [ 5,  6],
      [ 7,  8],
      [ 9, 10],
      [11, 12]])

生成的張量 reshaped_images 將具有 (16, 3, 64, 64) 的形狀，其影像資料與原始張量相同。

置換維度

“view”方法還提供了重新組織張量維度的能力。當需要重新排序維度以符合特定模型或操作輸入標準時，此功能非常有價值。例如，讓我們考慮一個形狀為 (10, 20, 30) 的張量 z，以及交換第二維和第三維的要求。透過結合使用“view”方法和 permute 函式，我們可以按以下方式完成此任務：

示例

import torch
z = torch.randn(10, 20, 30)
permuted_z = z.permute(0, 2, 1).contiguous().view(10, 30, 20)
print(permuted_z)

輸出

C:\Users\Tutorialspoint>python main.py
tensor([[[-8.7789e-01,  3.7140e-01, -1.2371e-01,  ..., -6.0913e-01,
       -2.0657e-01, -4.6924e-01],
      [ 1.3396e+00, -2.6931e-01, -1.5918e+00,  ...,  1.8112e+00,
       -5.6218e-01,  6.3811e-01],
      [-1.5859e+00,  5.2675e-01,  9.0149e-01,  ...,  2.3284e+00,
      -1.1363e+00,  1.2419e+00],………………………..
[-4.0291e-01,  5.4051e-02, -8.2667e-01,  ...,  1.6827e+00,
         -8.7097e-02, -1.0874e+00]]])

在上面的示例中，我們首先使用 permute 交換第二維和第三維。然後，我們使用 contiguous() 確保張量是連續的，最後應用“view”方法將其重塑為所需的形狀 (10, 30, 20)。

結論

總之，Python 的 PyTorch 庫中的“view”方法提供了一種強大的方法來重塑張量，而不會修改底層資料。透過利用“view”方法，開發人員可以有效地操作張量形狀以滿足特定神經網路架構的要求。無論是調整張量大小、展平它們、調整批次大小還是置換維度，“view”方法都為在 PyTorch 中有效地操作張量提供了靈活性和多功能性。

普里亞·米什拉 (Priya Mishra)

更新於：2023年7月24日

瀏覽量：157

啟動您的職業生涯

完成課程獲得認證

開始學習