如何使用TensorFlow清洗資料,並利用Auto MPG資料集預測燃油效率?


TensorFlow是谷歌提供的機器學習框架。它是一個開源框架,與Python結合使用,可以實現演算法、深度學習應用程式等等。

可以使用以下程式碼行在Windows上安裝“tensorflow”包:

pip install tensorflow

張量是TensorFlow中使用的資料結構。它有助於連線資料流圖中的邊。這個資料流圖被稱為“資料流圖”。張量只不過是多維陣列或列表。

迴歸問題的目的是預測連續或離散變數的輸出,例如價格、機率、是否下雨等等。

我們使用的資料集稱為“Auto MPG”資料集。它包含1970年代和1980年代汽車的燃油效率。它包括重量、馬力、排量等等屬性。我們需要根據這些資料預測特定車輛的燃油效率。

我們使用Google Colaboratory執行以下程式碼。Google Colab或Colaboratory幫助在瀏覽器上執行Python程式碼,無需任何配置,並且可以免費訪問GPU(圖形處理單元)。Colaboratory構建在Jupyter Notebook之上。

以下程式碼片段將展示如何使用TensorFlow清洗資料,並利用Auto MPG資料集預測燃油效率:

示例

print("Data cleaning has begun")
dataset.isna().sum()
dataset = dataset.dropna()
dataset['Origin'] = dataset['Origin'].map({1: 'USA', 2: 'Europe', 3: 'Japan'})

print("Data cleaning complete!")
dataset = pd.get_dummies(dataset, prefix='', prefix_sep='')

print("A sample of dataset after data cleaning :")
dataset.head(4)

程式碼來源 − https://www.tensorflow.org/tutorials/keras/regression

輸出

Data cleaning has begun
Data cleaning complete!
A sample of dataset after data cleaning −



MPG氣缸數排量馬力重量加速車型年份歐洲日本美國
018.08307.0130.03504.012.070001
115.08350.0165.03693.011.570001
218.08318.0150.03436.011.070001
316.08304.0150.03433.012.070001

解釋

  • 資料清洗首先刪除資料集中存在的“nan”值。

  • 使用“map”函式將標籤對映到列名。

  • 資料清洗後,資料集的樣本顯示在控制檯上。

更新於:2021年1月20日

134 次瀏覽

啟動您的職業生涯

完成課程後獲得認證

開始學習
廣告
© . All rights reserved.