1K+ 次瀏覽
隨機森林是一種監督式機器學習演算法,透過在資料樣本上建立決策樹來用於分類、迴歸和其他任務。建立決策樹後,隨機森林分類器收集每個決策樹的預測結果,並透過投票選擇最佳方案。隨機森林分類器的一大優勢在於它透過平均結果來減少過擬合。這就是為什麼與單個決策樹相比,我們可以獲得更好的結果的原因。建立隨機森林分類器的步驟 我們可以按照以下步驟建立隨機森林…… 閱讀更多
262 次瀏覽
藉助 Scikit-learn Python 庫,我們可以獲取資料集的類似字典的物件。類似字典的物件的一些有趣屬性如下:data - 它表示要學習的資料。target - 它表示迴歸目標。DESCR - 資料集的描述。target_names - 它給出資料集的目標名稱。feature_names - 它給出資料集的特徵名稱。示例 1 在下面的示例中,我們使用加利福尼亞住房資料集來獲取其類似字典的物件。# 匯入必要的庫 import sklearn import pandas as ... 閱讀更多
3K+ 次瀏覽
二值化是一種預處理技術,當我們需要將資料轉換為二進位制數字(即需要對資料進行二值化)時使用。名為 Sklearn.preprocessing.binarize() 的 scikit-learn 函式用於對資料進行二值化。此二值化函式具有閾值引數,低於或等於此閾值的特徵值將替換為 0,高於此閾值的特徵值將替換為 1。在本教程中,我們將學習如何使用 Python 中的 Scikit-learn (Sklearn) 對資料和稀疏矩陣進行二值化。示例 讓我們來看一個將 NumPy 陣列預處理為二進位制數字的示例:# 匯入…… 閱讀更多
2K+ 次瀏覽
Python Scikit-learn 提供了 make_spd_matrix() 函式,我們可以用它來生成隨機對稱正定矩陣。在本教程中,我們將學習如何使用 Python 中的 Scikit-learn (Sklearn) 生成對稱正定矩陣和稀疏 spd 矩陣。為此,我們可以按照以下步驟操作:步驟 1 - 匯入執行程式所需的庫 sklearn.datasets.make_spd_matrix、matplotlib 和 seaborn。步驟 2 - 建立 make_spd_matrix() 的物件,並提供表示矩陣維數的 n_dim 引數的值。步驟 3 - 使用 matplotlib 庫設定輸出圖形的大小。步驟 4 - 使用 seaborn…… 閱讀更多
955 次瀏覽
Python Scikit-learn 提供了 make_regression() 函式,我們可以用它來生成隨機迴歸問題。在本教程中,我們將學習如何生成隨機迴歸問題以及具有稀疏不相關設計的隨機迴歸問題。隨機迴歸問題 若要使用 Python Scikit-learn 生成隨機迴歸問題,我們可以按照以下步驟操作:步驟 1 - 匯入執行程式所需的庫 sklearn.datasets.make_regression 和 matplotlib。步驟 2 - 提供樣本數量和其他引數。步驟 3 - 使用 matplotlib 庫設定輸出圖形的大小和樣式。步驟 4 -…… 閱讀更多
4K+ 次瀏覽
Scikit-learn 提供了 make_classification() 函式,我們可以用它來繪製具有不同數量的資訊特徵、每個類別的叢集和類別的隨機生成的分類資料集。在本教程中,我們將學習如何使用 Python Scikit-learn 生成和繪製分類資料集。具有一個資訊特徵和每個類別一個叢集的資料集 若要生成和繪製具有一個資訊特徵和一個叢集的分類資料集,我們可以執行以下步驟:步驟 1 - 匯入執行程式所需的庫 sklearn.datasets.make_classification 和 matplotlib。步驟 2 - 建立名為 X 和 y 的資料點…… 閱讀更多
353 次瀏覽
在本教程中,我們將學習如何使用 Python Scikit-learn (Sklearn) 為雙聚類生成具有恆定塊對角結構和塊棋盤結構的陣列。生成具有恆定塊對角結構的陣列 若要為雙聚類生成具有恆定塊對角結構的陣列,我們可以執行以下步驟:步驟 1 - 匯入 sklearn.datasets.make_biclusters 和 matplotlib。步驟 2 - 設定圖形大小步驟 3 - 建立名為 data、row 和 column 的資料點。步驟 4 - 建立一個繪圖器來顯示具有恆定塊對角結構的陣列。步驟 5 - 提供…… 閱讀更多
712 次瀏覽
在本教程中,我們將學習如何使用 Python Scikit-learn 建立樣本資料集。我們可以輕鬆地將各種內建 scikit-learn 資料集用於我們的 ML 模型,但有時我們需要一些玩具資料集。為此,scikit-learn Python 庫為我們提供了一個很棒的樣本資料集生成器。使用 Scikit-Learn 建立樣本 Blob 資料集 若要建立樣本 blob 資料集,我們需要匯入 sklearn.datsets.make_blobs,它非常快速且易於使用。示例 在以下示例中,讓我們看看如何使用此庫來建立樣本 blob 資料集。# 匯入庫 from sklearn.datasets import make_blobs ... 閱讀更多
12K+ 次瀏覽
Scikit-learn,也稱為 Sklearn,是一個非常有用且強大的開源 Python 庫,它使用統一的介面實現了機器學習和統計建模演算法,包括分類、迴歸、聚類和降維。Scikit-learn 庫是用 Python 編寫的,它建立在其他 Python 包之上,例如 NumPy(數值 Python)和 SciPy(科學 Python)。使用 pip 在 Windows 上安裝 Scikit-learn 若要在 Windows 上安裝 Scikit-learn,請按照以下步驟操作:步驟 1-確保已預安裝 Python 和 pip 在您的系統上開啟命令提示符,並鍵入以下命令以檢查是否已安裝 Python 和 pip…… 閱讀更多