如何使用TensorFlow將花卉資料集拆分為訓練集和驗證集？

可以使用 Keras 預處理 API 將花卉資料集拆分為訓練集和驗證集，藉助“image_dataset_from_directory”函式，該函式需要驗證集的百分比拆分。

使用 keras.Sequential 模型建立影像分類器，並使用 **preprocessing.image_dataset_from_directory** 載入資料。資料可以有效地從磁碟載入。識別過擬合併應用技術來緩解它。這些技術包括資料增強和 dropout。有 3700 張花卉影像。此資料集包含 5 個子目錄，每個類有一個子目錄。它們是：雛菊、蒲公英、玫瑰、向日葵和鬱金香。

我們正在使用 Google Colaboratory 來執行以下程式碼。Google Colab 或 Colaboratory 幫助在瀏覽器上執行 Python 程式碼，無需任何配置，並可免費訪問 GPU（圖形處理單元）。Colaboratory 建立在 Jupyter Notebook 之上。

batch_size = 32
img_height = 180
img_width = 180
print("The data is being split into training and validation set")
train_ds = tf.keras.preprocessing.image_dataset_from_directory(
   data_dir,
   validation_split=0.2,
   subset="training",
   seed=123,
   image_size=(img_height, img_width),
   batch_size=batch_size)

程式碼來源：https://www.tensorflow.org/tutorials/images/classification

輸出

The data is being split into training and validation set
Found 3670 files belonging to 5 classes.
Using 2936 files for training.

解釋

這些影像使用 image_dataset_from_directory 實用程式從磁碟載入。
這將從磁碟上的影像目錄轉換為 tf.data.Dataset。
下載資料後，將為載入程式定義一些引數。
資料被拆分為訓練集和驗證集。

AmitDiwan

更新於： 2021年2月20日

352 次瀏覽

開啟你的職業生涯

透過完成課程獲得認證

開始學習

如何使用TensorFlow將花卉資料集拆分為訓練集和驗證集？

輸出

解釋

開啟你的 職業生涯

開啟你的職業生涯