PyTorch - 載入資料



PyTorch 包含一個名為 TorchVision 的包,用於載入和準備資料集。它包含兩個基本函式,分別是 Dataset 和 DataLoader,可幫助轉換和載入資料集。

資料集

資料集用於讀取和轉換給定資料集中的資料點。實現的基本語法如下所示 −

trainset = torchvision.datasets.CIFAR10(root = './data', train = True,
   download = True, transform = transform)

DataLoader 用於混洗和批處理資料。它可以用於並行載入具有多程序工作程式的資料。

trainloader = torch.utils.data.DataLoader(trainset, batch_size = 4,
   shuffle = True, num_workers = 2)

示例: 載入 CSV 檔案

我們使用 Python 包 Panda 載入 csv 檔案。原始檔案具有以下格式:(影像名稱、68 個地標 - 每個地標都有 x、y 座標)。

landmarks_frame = pd.read_csv('faces/face_landmarks.csv')

n = 65
img_name = landmarks_frame.iloc[n, 0]
landmarks = landmarks_frame.iloc[n, 1:].as_matrix()
landmarks = landmarks.astype('float').reshape(-1, 2)
廣告