如何使用TensorFlow清洗資料,並利用Auto MPG資料集預測燃油效率?
TensorFlow是谷歌提供的機器學習框架。它是一個開源框架,與Python結合使用,可以實現演算法、深度學習應用程式等等。
可以使用以下程式碼行在Windows上安裝“tensorflow”包:
pip install tensorflow
張量是TensorFlow中使用的資料結構。它有助於連線資料流圖中的邊。這個資料流圖被稱為“資料流圖”。張量只不過是多維陣列或列表。
迴歸問題的目的是預測連續或離散變數的輸出,例如價格、機率、是否下雨等等。
我們使用的資料集稱為“Auto MPG”資料集。它包含1970年代和1980年代汽車的燃油效率。它包括重量、馬力、排量等等屬性。我們需要根據這些資料預測特定車輛的燃油效率。
我們使用Google Colaboratory執行以下程式碼。Google Colab或Colaboratory幫助在瀏覽器上執行Python程式碼,無需任何配置,並且可以免費訪問GPU(圖形處理單元)。Colaboratory構建在Jupyter Notebook之上。
以下程式碼片段將展示如何使用TensorFlow清洗資料,並利用Auto MPG資料集預測燃油效率:
示例
print("Data cleaning has begun")
dataset.isna().sum()
dataset = dataset.dropna()
dataset['Origin'] = dataset['Origin'].map({1: 'USA', 2: 'Europe', 3: 'Japan'})
print("Data cleaning complete!")
dataset = pd.get_dummies(dataset, prefix='', prefix_sep='')
print("A sample of dataset after data cleaning :")
dataset.head(4)程式碼來源 − https://www.tensorflow.org/tutorials/keras/regression
輸出
Data cleaning has begun Data cleaning complete! A sample of dataset after data cleaning −
| MPG | 氣缸數 | 排量 | 馬力 | 重量 | 加速 | 車型年份 | 歐洲 | 日本 | 美國 | |
|---|---|---|---|---|---|---|---|---|---|---|
| 0 | 18.0 | 8 | 307.0 | 130.0 | 3504.0 | 12.0 | 70 | 0 | 0 | 1 |
| 1 | 15.0 | 8 | 350.0 | 165.0 | 3693.0 | 11.5 | 70 | 0 | 0 | 1 |
| 2 | 18.0 | 8 | 318.0 | 150.0 | 3436.0 | 11.0 | 70 | 0 | 0 | 1 |
| 3 | 16.0 | 8 | 304.0 | 150.0 | 3433.0 | 12.0 | 70 | 0 | 0 | 1 |
解釋
資料清洗首先刪除資料集中存在的“nan”值。
使用“map”函式將標籤對映到列名。
資料清洗後,資料集的樣本顯示在控制檯上。
廣告
資料結構
網路
關係資料庫管理系統 (RDBMS)
作業系統
Java
iOS
HTML
CSS
Android
Python
C語言程式設計
C++
C#
MongoDB
MySQL
Javascript
PHP