如何使用scikit-learn管道工具中的簡化流程將輸入資料陣列轉換為新的資料陣列?


Scikit-learn,通常稱為sklearn,是Python中用於實現機器學習演算法的庫。它是一個開源庫,因此可以免費使用。

它功能強大且健壯,因為它提供了各種工具來執行統計建模。這包括分類、迴歸、聚類、降維等等,藉助於Python中強大且穩定的介面。

該庫基於NumPy、SciPy和Matplotlib庫。

可以使用以下所示的“pip”命令安裝它:

pip install scikit−learn

該庫專注於資料建模。

可以使用“Pipeline”函式實現簡化操作,該函式可以將特定維度的陣列轉換為不同維度的陣列。

以下是一個示例:

示例

from sklearn.preprocessing import PolynomialFeatures
from sklearn.linear_model import LinearRegression
from sklearn.pipeline import Pipeline
import numpy as np
print("Creating object of the tool pipeline")
Stream_model = Pipeline([('poly', PolynomialFeatures(degree=3)), ('linear', LinearRegression(fit_intercept=False))])
x = np.arange(6)
print("The size of the original ndarray is")
print(x.shape)
y = 4 − 2 * x + x ** 2 - x ** 3.5
Stream_model = Stream_model.fit(x[:, np.newaxis], y)
print("Input polynomial coefficients are")
print(Stream_model.named_steps['linear'].coef_)

輸出

Creating object of the tool pipeline
The size of the original ndarray is
(6,)
Input polynomial coefficients are
[ 4.31339202 −7.82933051 7.96372751 −3.39570215]

解釋

  • 匯入所需的包,併為方便使用賦予它們別名。

  • 使用“Pipeline”函式建立整個過程的管道。

  • 使用NumPy庫生成資料點“x”和“y”的值。

  • 呼叫“LinearRegression”函式。

  • 生成的資料詳情將顯示在控制檯上。

  • 使用“Pipeline”函式建立的模型適合資料。

  • 資料的線性係數將顯示在控制檯上。

更新於:2021年1月18日

132 次檢視

啟動您的職業生涯

透過完成課程獲得認證

開始
廣告
© . All rights reserved.