如何在Python中使用TensorFlow結合提升樹?


TensorFlow可以與提升樹結合使用,以提高資料集的預測效能。資料按照通常的方式載入和預處理,但在進行預測時,會使用多個模型進行預測,並將所有這些模型的輸出組合起來以得到最終結果。

閱讀更多: 什麼是TensorFlow以及Keras如何與TensorFlow一起建立神經網路?

我們將使用Keras Sequential API,這有助於構建一個順序模型,用於處理簡單的層堆疊,其中每一層只有一個輸入張量和一個輸出張量。

包含至少一層卷積層的神經網路稱為卷積神經網路。我們可以使用卷積神經網路來構建學習模型。

我們使用Google Colaboratory執行以下程式碼。Google Colab或Colaboratory幫助在瀏覽器上執行Python程式碼,無需任何配置,並可免費訪問GPU(圖形處理單元)。Colaboratory構建在Jupyter Notebook之上。

我們將瞭解如何使用決策樹和tf.estimator API訓練梯度提升模型。提升樹模型被認為是迴歸和分類中最流行和有效的機器學習方法。這是一種整合技術,它結合了來自許多(10個、100個或1000個)樹模型的預測。它們有助於在最少的超引數調整下實現令人印象深刻的效能。

示例

import numpy as np
import pandas as pd
from IPython.display import clear_output
from matplotlib import pyplot as plt
print("Load the dataset")
dftrain = pd.read_csv('https://storage.googleapis.com/tf-datasets/titanic/train.csv')
dfeval = pd.read_csv('https://storage.googleapis.com/tf-datasets/titanic/eval.csv')
print("Delete the column 'survived'")
y_train = dftrain.pop('survived')
y_eval = dfeval.pop('survived')
import tensorflow as tf
tf.random.set_seed(123)

程式碼來源 −https://www.tensorflow.org/tutorials/estimator/boosted_trees

輸出

Load the dataset
Delete the column 'survived'

解釋

  • 匯入所需的包。
  • 載入資料集。
  • 將其讀取為csv檔案。
  • 刪除'survived'列。

更新於: 2021年2月25日

132次瀏覽

啟動你的職業生涯

完成課程獲得認證

開始學習
廣告