如何使用TensorFlow載入花卉資料集並進行處理?


我們將使用花卉資料集,其中包含數千張花卉影像。它包含5個子目錄,每個類別都有一個子目錄。

閱讀更多: 什麼是TensorFlow以及Keras如何與TensorFlow一起建立神經網路?

使用‘get_file’方法下載花卉資料集後,它將被載入到環境中以進行處理。載入引數已明確說明,載入的資料被分成訓練集和驗證集。

我們使用Google Colaboratory執行以下程式碼。Google Colab或Colaboratory幫助在瀏覽器上執行Python程式碼,無需任何配置,並且可以免費訪問GPU(圖形處理單元)。Colaboratory構建在Jupyter Notebook之上。

print("Loading parameters for the loader")
batch_size = 32
img_height = 180
img_width = 180

print("Preprocessing the image dataset using Keras")
print("Splitting dataset into training and validation set ")

train_ds = tf.keras.preprocessing.image_dataset_from_directory(
   data_dir,
   validation_split=0.2,
   subset="training",
   seed=123,
   image_size=(img_height, img_width),
   batch_size=batch_size)

print("Splitting dataset into training and validation set ")
val_ds = tf.keras.preprocessing.image_dataset_from_directory(
   data_dir,
   validation_split=0.2,
   subset="validation",
   seed=123,
   image_size=(img_height, img_width),
   batch_size=batch_size)

print("Printing the class names present in sub-directories")
class_names = train_ds.class_names
print(class_names)

程式碼來源:https://www.tensorflow.org/tutorials/load_data/images

輸出

Loading parameters for the loader
Preprocessing the image dataset using Keras
Splitting dataset into training and validation set
Found 3670 files belonging to 5 classes.
Using 2936 files for training.
Splitting dataset into training and validation set
Found 3670 files belonging to 5 classes.
Using 734 files for validation.
Printing the class names present in sub-directories
['daisy', 'dandelion', 'roses', 'sunflowers', 'tulips']

解釋

  • 引數已定義。
  • 資料集被分成訓練集和驗證集。
  • 每張影像分類的類別名稱將顯示在控制檯上。

更新於:2021年2月19日

153 次瀏覽

啟動您的職業生涯

透過完成課程獲得認證

開始學習
廣告
© . All rights reserved.