如何在 Python 中使用 TensorFlow 預處理 Fashion MNIST 資料?


TensorFlow 是 Google 提供的一個機器學習框架。它是一個開源框架,與 Python 結合使用可以實現演算法、深度學習應用程式等等。它用於研究和生產目的。

可以使用以下程式碼行在 Windows 上安裝 “tensorflow” 包:

pip install tensorflow

張量 (Tensor) 是 TensorFlow 中使用的一種資料結構。它有助於連線資料流圖中的邊。這個資料流圖被稱為“資料流圖”。張量只不過是多維陣列或列表。

“Fashion MNIST” 資料集包含各種服裝的影像。它包含超過 7 萬件屬於 10 個不同類別的服裝的灰度影像。這些影像是低解析度的 (28 x 28 畫素)。我們使用 Google Colaboratory 來執行以下程式碼。Google

Colab 或 Colaboratory 幫助在瀏覽器上執行 Python 程式碼,無需任何配置,並可免費訪問 GPU(圖形處理單元)。Colaboratory 建立在 Jupyter Notebook 之上。

以下是程式碼片段:

示例

plt.figure()
plt.imshow(train_images[0])
plt.colorbar()
plt.grid(False)
plt.show()

train_images = train_images / 255.0

test_images = test_images / 255.0

plt.figure(figsize=(12,12))
for i in range(15):
    plt.subplot(5,5,i+1)
    plt.xticks([])
    plt.yticks([])
    plt.grid(False)
    plt.imshow(train_images[i], cmap=plt.cm.binary)
    plt.xlabel(class_names[train_labels[i]])
plt.show()

程式碼來源https://www.tensorflow.org/tutorials/keras/classification

輸出

解釋

  • 在訓練網路之前,需要預處理輸入資料集。

  • 在檢查影像並在控制檯上顯示後,可以確定畫素值範圍在 0 到 255 之間。

  • 首先將這些畫素值縮放至 0 到 1 的範圍。

  • 為此,將每個畫素值除以 255。

  • 訓練資料集和測試資料集必須以相同的方式進行預處理。

  • 這確保了在訓練和評估期間提供相同型別的資料。

  • 為了確保資料格式正確,請在控制檯上顯示前幾張影像以及每張影像所屬的類別名稱。

更新於:2021年1月20日

183 次瀏覽

開啟你的職業生涯

完成課程獲得認證

開始學習
廣告
© . All rights reserved.