如何使用TensorFlow清洗資料，並利用Auto MPG資料集預測燃油效率？

TensorFlow是谷歌提供的機器學習框架。它是一個開源框架，與Python結合使用，可以實現演算法、深度學習應用程式等等。

可以使用以下程式碼行在Windows上安裝“tensorflow”包：

pip install tensorflow

張量是TensorFlow中使用的資料結構。它有助於連線資料流圖中的邊。這個資料流圖被稱為“資料流圖”。張量只不過是多維陣列或列表。

迴歸問題的目的是預測連續或離散變數的輸出，例如價格、機率、是否下雨等等。

我們使用的資料集稱為“Auto MPG”資料集。它包含1970年代和1980年代汽車的燃油效率。它包括重量、馬力、排量等等屬性。我們需要根據這些資料預測特定車輛的燃油效率。

我們使用Google Colaboratory執行以下程式碼。Google Colab或Colaboratory幫助在瀏覽器上執行Python程式碼，無需任何配置，並且可以免費訪問GPU（圖形處理單元）。Colaboratory構建在Jupyter Notebook之上。

以下程式碼片段將展示如何使用TensorFlow清洗資料，並利用Auto MPG資料集預測燃油效率：

示例

print("Data cleaning has begun")
dataset.isna().sum()
dataset = dataset.dropna()
dataset['Origin'] = dataset['Origin'].map({1: 'USA', 2: 'Europe', 3: 'Japan'})

print("Data cleaning complete!")
dataset = pd.get_dummies(dataset, prefix='', prefix_sep='')

print("A sample of dataset after data cleaning :")
dataset.head(4)

程式碼來源 − https://www.tensorflow.org/tutorials/keras/regression

輸出

Data cleaning has begun
Data cleaning complete!
A sample of dataset after data cleaning −

	MPG	氣缸數	排量	馬力	重量	加速	車型年份	美國
0	18.0	8	307.0	130.0	3504.0	12.0	70	1
1	15.0	8	350.0	165.0	3693.0	11.5	70	1
2	18.0	8	318.0	150.0	3436.0	11.0	70	1
3	16.0	8	304.0	150.0	3433.0	12.0	70	1

解釋

資料清洗首先刪除資料集中存在的“nan”值。
使用“map”函式將標籤對映到列名。
資料清洗後，資料集的樣本顯示在控制檯上。

AmitDiwan

更新於：2021年1月20日

134 次瀏覽

啟動您的職業生涯

完成課程後獲得認證

開始學習