如何使用scikit-learn管道工具中的簡化流程將輸入資料陣列轉換為新的資料陣列?
Scikit-learn,通常稱為sklearn,是Python中用於實現機器學習演算法的庫。它是一個開源庫,因此可以免費使用。
它功能強大且健壯,因為它提供了各種工具來執行統計建模。這包括分類、迴歸、聚類、降維等等,藉助於Python中強大且穩定的介面。
該庫基於NumPy、SciPy和Matplotlib庫。
可以使用以下所示的“pip”命令安裝它:
pip install scikit−learn
該庫專注於資料建模。
可以使用“Pipeline”函式實現簡化操作,該函式可以將特定維度的陣列轉換為不同維度的陣列。
以下是一個示例:
示例
from sklearn.preprocessing import PolynomialFeatures
from sklearn.linear_model import LinearRegression
from sklearn.pipeline import Pipeline
import numpy as np
print("Creating object of the tool pipeline")
Stream_model = Pipeline([('poly', PolynomialFeatures(degree=3)), ('linear', LinearRegression(fit_intercept=False))])
x = np.arange(6)
print("The size of the original ndarray is")
print(x.shape)
y = 4 − 2 * x + x ** 2 - x ** 3.5
Stream_model = Stream_model.fit(x[:, np.newaxis], y)
print("Input polynomial coefficients are")
print(Stream_model.named_steps['linear'].coef_)輸出
Creating object of the tool pipeline The size of the original ndarray is (6,) Input polynomial coefficients are [ 4.31339202 −7.82933051 7.96372751 −3.39570215]
解釋
匯入所需的包,併為方便使用賦予它們別名。
使用“Pipeline”函式建立整個過程的管道。
使用NumPy庫生成資料點“x”和“y”的值。
呼叫“LinearRegression”函式。
生成的資料詳情將顯示在控制檯上。
使用“Pipeline”函式建立的模型適合資料。
資料的線性係數將顯示在控制檯上。
廣告
資料結構
網路
關係資料庫管理系統 (RDBMS)
作業系統
Java
iOS
HTML
CSS
Android
Python
C語言程式設計
C++
C#
MongoDB
MySQL
Javascript
PHP